Gene TM1040_0404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0404
Symbol
ID	4078798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	413522
End bp	414805
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	63%
IMG OID	638005699
Product	cytochrome c, class I
Protein accession	YP_612399
Protein GI	99080245
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG2319] FOG: WD40 repeat [COG3474] Cytochrome c2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.06087
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCGGC GACTGGCTCT TGGCCTGCTC CTCTGCGCCG CCTCTGGGGT GAGCGCGGAG 
GAGTTCCAGA CCCTCAAAGG ACACGGAGGG CCGATCATGG CGCTTGCCGT GAACGATCGG 
GGGCACGTGG CCAGCGCCAG TTTCGACAAT TCCGTCTCAC TCTGGCAGGA GGGGGCGCCG 
AGCTGGCTCG AGGCACATGA AGCAGCCGCG ACCGTGGTGG CCTTTGGCCC TGATGATACC 
CTGTTCAGCG CAGGCGACGA CTTTGTGATT TATCGCTGGC AGCAGGGCCA CCCCCAAGAG 
ATCGGACGGC ATACCGCCAA GATCCGCGCC TTGGACCTCT CGCGCGATGG GGAATGGCTC 
GCCTCCGCAA GCTGGGATGG CGGCATTGGT CTTTGGCCTA TGAGTGCGGG CACGCCCCGC 
CGCATCGCGG TTGGAACGGG CGTGAACGAT CTTGCCTTTG ACGGGGCCGG TCGCCTCTTC 
GTCGCCACCA TGACCGGGCA GATCCAAGTC TTCGACAGCC CGGAGGCTGC CCCACGAATT 
CTGGCGGAAC AAGGGTTTGG CATCAACCGT TTGGTGCTCT CTGCTGCTGG CTGGCTGGCC 
TATGGCGCCG TTGATGGCGG CACCCGTGTG ATCAACGCAG AAACCGGGGC CGAGATTGCC 
GATTTCACCC TCGACCGGCG GCCCATACTG GCCCTTGCGC ATCATGCCGA GAGCCAGCAG 
ATCGCCGTGG GTGATGGGCA TGGCTATATC ATGATGATCG ACACACACGA CTGGAGCATT 
GCGCGCGATT TTCGGGCCAT GCGCGAAGGC CCCGTCTGGG CTCTGGCGTT TTCAAAGGAC 
GGCCAGCGGG TCTGGGCAGG CGGCATACAC GATGTGATCT ATGGCTGGCC CATCGCGCTG 
ATGGCCAGCA GCCCAGCGGC GGGAACCGAG ACCCGCACAT TCCTGCAGGC GCCTGAAACC 
ATGCCCAATG GTGAGCGCCA ATTCATGCGA AAATGCTCGG TTTGCCACGA TTTGGTCGCC 
ACAGAGCAGC GGCGCGCCGG TCCTCATCTG GCGGGGCTCT TTGGACGACC GGCCGGCAGT 
CTGCCTGGCT ATCGGTATTC CGACACGCTG GCGCAGTCTG ACATCATCTG GGGTGCCGAG 
ACCATCGATG CCCTGTTCGA TCTCGGCCCT GACCATTATA TTCCGGGGTC CAAGATGCCG 
ATGCAGCGCA TCACCGCCCC CACAGATCGC CAAGATCTGA TAGACTATCT GAAAACCGCG 
ACACAACTTT CGGAGGATAA TTGA

Protein sequence

MLRRLALGLL LCAASGVSAE EFQTLKGHGG PIMALAVNDR GHVASASFDN SVSLWQEGAP 
SWLEAHEAAA TVVAFGPDDT LFSAGDDFVI YRWQQGHPQE IGRHTAKIRA LDLSRDGEWL 
ASASWDGGIG LWPMSAGTPR RIAVGTGVND LAFDGAGRLF VATMTGQIQV FDSPEAAPRI 
LAEQGFGINR LVLSAAGWLA YGAVDGGTRV INAETGAEIA DFTLDRRPIL ALAHHAESQQ 
IAVGDGHGYI MMIDTHDWSI ARDFRAMREG PVWALAFSKD GQRVWAGGIH DVIYGWPIAL 
MASSPAAGTE TRTFLQAPET MPNGERQFMR KCSVCHDLVA TEQRRAGPHL AGLFGRPAGS 
LPGYRYSDTL AQSDIIWGAE TIDALFDLGP DHYIPGSKMP MQRITAPTDR QDLIDYLKTA 
TQLSEDN