Gene Rpal_4063 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4063
Symbol
ID	6411747
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4361662
End bp	4362903
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	70%
IMG OID	642713945
Product	Extensin family protein
Protein accession	YP_001993034
Protein GI	192292429
COG category	[S] Function unknown
COG ID	[COG3921] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCGCG GAGTTCGTTT GTATCTCGTC GGCTCCTTCG TCCTCGTCTC TCTCGCGGGT 
TGCGGTCGCG GTCTGTTTCA GACCGCCGAG CGCGAACCGT GGCGAGCCGA GGCCGAGATC 
GCGTGCTTGA AATCCGGCGT GGTCCGCGAA GGACCGGATC TGGTCCGGAT CGATCCGATC 
TCAGGCCCTG GTGTGTGTGG TGCCGAGTTT CCGCTGAAGG TGGCGGCGCT CGGCGAAACC 
GGCGCGATCG GTTTCGCCGA CGATCTGCGG CCGCCGGGTG CGATCGGCGG TGCCGGCCAA 
AGCCAGCCGC GCTGGCCGGG CGGCCAGCCG CAACCGAACT ACGCGACACC TCAACGTGGC 
TATGCCGAAC CGCCGGCGCG CGCGCCGAAC TACGGCGCAC AGCCGCAGGC CGGCTACGGC 
GCGCCGCAGG GCGGCTACGG CAAAGCGCCG GTGTCGCTGA ACGCGCCGGG CGTGGGGCCG 
GCTCAGGACG ATATCGAACT GCCGCCGGAA GGCGAGCCGT CCGCCGAGCG TCCGCCGGCC 
GAGAACGTCA CCGGCTATCC GCGCGGTGCT GCGCCGCAGG GCGGCTATCC CGGCGAAGCG 
GAGCGGCCGC TGCCGCGGCT CGGCCCGGGC CAGCAGGGCG GCATCACCGG CTCGGTGGGG 
CCGGTTGCGA TCAAGCCGAC CGCGACGCTG GCGTGTCCGA TCGTGTCGGC GCTCGATCGC 
TGGCTGGCGG AATCCGTGCA GCCTTCGGCG ATGCGCTGGT TCGGCGTCCG CGTCGTCGAG 
ATCAAGCAGA TCTCGGCGTA TTCGTGCCGC GGCATGAACG GCAATCCGAA CGCCCACATC 
TCCGAACACG CATTCGGCAA CGCGCTCGAT ATCGCCGCCT TCGTGCTGGC CGATGGCCGC 
CGCATCACCG TCAAGGGCGG CTGGCGTGGA TTGCCGGAGG AGCAGGCGTT CCTGCACGAC 
GTGCAGAACT CGGCGTGCCA GATGTTCACC ACGGTGCTGG CGCCGGGCTC GAACGTCTAT 
CACTACGATC ACATCCACGT CGATCTGATG CGGCGGCGCA GCCAGCGCAC GATCTGCAAG 
CCGGCCGCGG TGTCCGGCGA AGTGATCGCG CAGCGGCTGC AGCAGCGCAA TCCTTACGCG 
GGCAGTGCGT CGCCGGGGCC GGGCTGGAAC GGCGTCACCG GCTCGATCGG CCGCAACGCG 
TCGCGCCACA AGGTCGATCG CGACGAGGCC GAGGACGATT AG

Protein sequence

MTRGVRLYLV GSFVLVSLAG CGRGLFQTAE REPWRAEAEI ACLKSGVVRE GPDLVRIDPI 
SGPGVCGAEF PLKVAALGET GAIGFADDLR PPGAIGGAGQ SQPRWPGGQP QPNYATPQRG 
YAEPPARAPN YGAQPQAGYG APQGGYGKAP VSLNAPGVGP AQDDIELPPE GEPSAERPPA 
ENVTGYPRGA APQGGYPGEA ERPLPRLGPG QQGGITGSVG PVAIKPTATL ACPIVSALDR 
WLAESVQPSA MRWFGVRVVE IKQISAYSCR GMNGNPNAHI SEHAFGNALD IAAFVLADGR 
RITVKGGWRG LPEEQAFLHD VQNSACQMFT TVLAPGSNVY HYDHIHVDLM RRRSQRTICK 
PAAVSGEVIA QRLQQRNPYA GSASPGPGWN GVTGSIGRNA SRHKVDRDEA EDD