Gene TM1040_0680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0680
Symbol
ID	4077288
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	727602
End bp	728786
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	64%
IMG OID	638005977
Product	HI0933-like protein
Protein accession	YP_612675
Protein GI	99080521
COG category	[R] General function prediction only
COG ID	[COG2081] Predicted flavoproteins
TIGRFAM ID	[TIGR00275] flavoprotein, HI0933 family

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.192167
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCCCA TGCGGATAAA AACCTTGATT CTCGGCGCCG GCGCGGCTGG CATGATGTGT 
GCAGCCCATG CAGGGGGCGA TTGCCTCGTG GTGGACCACG CCAAGTCCCC CGGAGAGAAG 
ATCCGCATCT CCGGCGGCGG GCGCTGCAAT TTTACCAATA TGTATGCCGC ACCCGAGAAT 
TACATCTCGC AGAACCCGCA TTTCTGTAAA TCTGCGCTGG CCCGCTACAC GCAATGGGAT 
TTCATTGACC TCGTGGGCCG TCATGGCATC GCGTGGCATG AAAAAACGCT TGGCCAGCTC 
TTTTGCGATG ACTCCGCACG CCAGATCGTC GCGATGCTGG TCAAAGAATT GCGCGACGCC 
GGGGCTGACC TGTGGTTGCA GACCTCGGTC GCGGATGTGG TGCATGGCCG TGACGGATAC 
ACCGTCCGCC TCGAGCGCGA GGGCAAGCCC GTGACGATCA CGGCTCAGAA CCTCGTGCTG 
GCAACCGGTG GCAAATCGAT CCCCAAGATG GGCGCGACGG GTCTTGCCTA TGACATCGCG 
GGGCAGTTTG GGCTGCCCGT CCTTGAGACC CGCCCCGGGC TTGTTCCCCT CACCTTTGGC 
GAGGGGCGTT TCAAACCTTT GGCCGGGGTC TCGGTGCCCG CACGGCTCTC CAATACTGCG 
GCCAGTTTTG ACGAGGCGCT GCTCTTCACC CATCGGGGCC TCTCTGGACC GGCGGTTCTG 
CAGATCTCGA GCTATTGGCG CGAAGGAGAG GACATCTTGG TCCACCTGCT GCCGGAACTG 
GATCTTTTTT CGGCCCTGCG CGCGCAACGT CAGGAAAGCG GGCGCAAGGA TCTGACAACC 
GAACTGGCGC GCCACCTGCC TGCACGGTTG GTGGAGGAGC TGGCGCAGGA CGGCAGCCTC 
AGGGGGCGTT TGGCCGATCA GTCCGATGCA GCGCTCGAAG CCCTCTGCGC GCGGCTGCAC 
AGTTGGCGAC TGAAGCCCAC CGGCACCGAG GGCTATCGCA CCGCCGAAGT GACGCTGGGC 
GGGATCGACA CCGATGCACT GTCGTCGCGC TCGATGGAGG CCAAGGCGCA GCCCGGCCTC 
TATGTAATCG GCGAAGCGGT GGACGTGACC GGCTGGCTCG GCGGCTATAA CTTCCAGTGG 
GCCTGGGCGT CGGGCCACGC CGCAGGCACC GCCATTCGGG GCTGA

Protein sequence

MRPMRIKTLI LGAGAAGMMC AAHAGGDCLV VDHAKSPGEK IRISGGGRCN FTNMYAAPEN 
YISQNPHFCK SALARYTQWD FIDLVGRHGI AWHEKTLGQL FCDDSARQIV AMLVKELRDA 
GADLWLQTSV ADVVHGRDGY TVRLEREGKP VTITAQNLVL ATGGKSIPKM GATGLAYDIA 
GQFGLPVLET RPGLVPLTFG EGRFKPLAGV SVPARLSNTA ASFDEALLFT HRGLSGPAVL 
QISSYWREGE DILVHLLPEL DLFSALRAQR QESGRKDLTT ELARHLPARL VEELAQDGSL 
RGRLADQSDA ALEALCARLH SWRLKPTGTE GYRTAEVTLG GIDTDALSSR SMEAKAQPGL 
YVIGEAVDVT GWLGGYNFQW AWASGHAAGT AIRG