Gene TM1040_2195 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2195
Symbol
ID	4078186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2304591
End bp	2306279
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	63%
IMG OID	638007517
Product	band 7 protein
Protein accession	YP_614189
Protein GI	99082035
COG category	[S] Function unknown
COG ID	[COG2268] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.807864
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGGAT CTTTCCTATT GGTGCCTGTC ATCAGTATCT TGGCGCTGGT TGCCCTCATC 
GGGCTTGTCC TTGGACGGCT CTATCGCCGG GCCACCCGTG AAGTCAGCCT GGTAAAGACC 
GGCTCTGGCG GCAAAAAGGT CATTATGGAC GGCGGTACGG TTGTGGTTCC GCTGCTGCAT 
GAAATCAGCC CGGTCAACAT GAAGACCCTG CGTCTGGAGG TGCAGCGCTC GGGTGAGGCG 
GCACTCATTA CCCAGGACCG CATGCGGGTC GATGTGGGTG TGGAGTTCTA CGTCTCGGTG 
ATGGCCACCG AAGAAGGGAT TTCGCGCGCG GCGCAGACGC TTGGGGACCG CACATTCGAT 
GTCGAGCAGC TGCGCGAGAT GATCGAAGGC AAGCTCATCG ATGGTCTGCG CGCCGTGGCG 
GCCCAGATGA CGATGGACGG GCTCCATGAA AACCGCGCCG ATTTTGTGCA GGAGGTGCAG 
AATGCCGTCT CCGAGGATCT GCTGAAAAAC GGTCTGTCGC TTGAATCCGT CTCGCTGACC 
GCGCTCGACC AGACACCCTT TGAGGCGCTG GATGAAAACA ACGCCTTCAA CGCGGTCGGT 
ATGCGCAAGC TGGCAGAGGT GATTGCGACC TCCAAAAAAG AGCGCGCGCA GATCGACGCA 
GAGGCAGAAG TCGCCGTGCG CCGCGCCGCA ATGGAAGCCG AGCGTCACAA GCTGTTGATC 
GAGCAGGATG AACAGCAGGC CCGCATCGAG CAGATGCAAA AGGTCGAGAC CATGCGAGTC 
GCCCAAGAGG CGGAGATCGC AGCCCGGACC GAGGACTCGG TGCGCGAAAC AGAACGCGCG 
CGGATCGCCC GCGAAGAAGC CATCCGCGCC GCCGATATTG AGCGCGAGCG CAAGATCCGC 
GAGGCCGAGA TCACCAAGGA GCGCGAACTG GAGGTGGCCG AGCAGGAACG CCAGATCATC 
ATTGCGCAGA AATCCGAGGA AGAAAGCCGC GCCCGCGCCT CTGCCGACCT CGCCCGTGCC 
GAGGCCATCA AGGCGACCGA GGCCGTCGCG ACCGCGCGTG AGGTGGCCGA GGCCGAGCGT 
CAAAAGCAGA TTGTCCTCAT TGAGGCTGCG CGAGAGGCAG AGCGTCAAGC CACTGGCATC 
CGTCTGGCCG CGCAGGCCGA AAAAGAAGCC GCCGCCGACC GCGCCGAGGC CCGTCGCGAG 
GAAGCACAGG CCGAGGCAGA CGCGCTCAAT ATTCGCGCGG AGGCCAAGAA AAACGACATG 
CTGGCCGAAG CGGAAGGTAA ACGCGCCCTT GTGGAGGCGG ACAATGCGCT CTCGCCGGAA 
CTGGTGCGCA TGAAGGTTGA CCTCGCTCGC ATCGAGGCGA TGCCCTCGAT CATTGCAGAG 
ATGGTGAAAC CGGCCGAGAA AATCGACTCG ATCAAGATCC ATCAGGTCGG TGGCGTGGGC 
GGCGGCGCGG CCTACAGCAG CGCGGGCGCC TCTGGCGACA AACCCGTGGT CAATCAGGCG 
CTCGATTCCA TCATGGGCAT GGCGGTGCAG ATGCCGGCGC TCAAAACACT GGGGCGTGAA 
CTGGGGATCT CAATGGAGGA CGGCGTGTCC GGCGTGGTGA ACGGCATGCT GGAGGGCAAT 
GACATCGCCC CCGAAGTCGC CGCCGACCCG GAGGCAACGG ATCAGGCGAA GACCTCAGAG 
GTTCACTAA

Protein sequence

MDGSFLLVPV ISILALVALI GLVLGRLYRR ATREVSLVKT GSGGKKVIMD GGTVVVPLLH 
EISPVNMKTL RLEVQRSGEA ALITQDRMRV DVGVEFYVSV MATEEGISRA AQTLGDRTFD 
VEQLREMIEG KLIDGLRAVA AQMTMDGLHE NRADFVQEVQ NAVSEDLLKN GLSLESVSLT 
ALDQTPFEAL DENNAFNAVG MRKLAEVIAT SKKERAQIDA EAEVAVRRAA MEAERHKLLI 
EQDEQQARIE QMQKVETMRV AQEAEIAART EDSVRETERA RIAREEAIRA ADIERERKIR 
EAEITKEREL EVAEQERQII IAQKSEEESR ARASADLARA EAIKATEAVA TAREVAEAER 
QKQIVLIEAA REAERQATGI RLAAQAEKEA AADRAEARRE EAQAEADALN IRAEAKKNDM 
LAEAEGKRAL VEADNALSPE LVRMKVDLAR IEAMPSIIAE MVKPAEKIDS IKIHQVGGVG 
GGAAYSSAGA SGDKPVVNQA LDSIMGMAVQ MPALKTLGRE LGISMEDGVS GVVNGMLEGN 
DIAPEVAADP EATDQAKTSE VH