Gene TM1040_2095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2095
Symbol
ID	4077846
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2199768
End bp	2202122
Gene Length	2355 bp
Protein Length	784 aa
Translation table	11
GC content	63%
IMG OID	638007414
Product	hypothetical protein
Protein accession	YP_614089
Protein GI	99081935
COG category	[N] Cell motility
COG ID	[COG1360] Flagellar motor protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCTCA AGCGGCGCAC TGGTCAACGG TTTCAAGGCT CGATCTGGCC CGGTTTCGTG 
GATGCGATGA CCGGACTTTT GCTGGTTTTG ATGTTTGTTC TCACCATTTT TATGGTGGTG 
CAATTTGTGC TGCGCGAGAC GATCTCGGGC CAGGAATCCG AGCTTGATGA ACTCTCGACC 
GAGGTGCGGG CGCTGGCAGA GGCACTTGGC GTCAAGGAAC GCGAGGCCAG CCAGTTGCAG 
GCCCGACTGG GCGCGCTGGG GGCGACGCTG TCCTCAACGC GCTCTGATCT TGATGCCGCG 
CGAGAGCAAA TTTCGAACCA GACCGCGCGG ATCAGCGCCC TGACGCAGGA ACGTGATGCC 
GCGAGATCGG ATCTTGCAAC GGCCCGCACG CAGATTTCCG ACTTTGAGGC GCAGGTGGCG 
GCTCTGATCG CTGGTCGTGA AAGTGCCGAG GCGCAGATTG CCGATCTCAC CGCCGAGCGG 
GACGCGCTTG ATGCGGCACG CAGCGAGTTG CTCTCAGAAC AGGAGGCGCT GAACCTTGCA 
TTGGCCCAAC TGCGCGAAGA GGTGGACGCG GAGGCCGAAG CCGCCCGTCT TGCCGCCGCT 
CAGACCGAGG CCCTGCAGGC GCTGGTGGAG GATCTGCGCG CAGAAGGGGC GGCACAGTCT 
GAACGCGTGA GTGCGCTCGA AGAGGCGCTC TCTGAAGAAG AGGCGACCCG GCTGGCTGAG 
GCCGCTGCGG CAGAGGCCCT GCGCGCGCGG TTGGAAAACG CGGATGCCGA ACTCACTGCA 
ATGACCCTTG CACTGGAAGA AGAGCGCAAG AAGGCCGAGG ACACGCTGAC GCTTCTGGCG 
GCTGCGGAGG CGGCGCGCGA CCAGCTTGAT ACGGAGCTTG AAGAGGCCTT GGCCGCGATT 
GAGCAAGCTA AGGCGCAGGT CAATGATCGC GACGAGTTGG CAGAGCGCCT GACCCGCGTT 
CTGGCCCAGA TGGAAGTCAC TGAAAGCACG GCAACGGCGC GAGTCTCGGC GCTTGAAGCG 
GAGCTGGAAC GCGTCAGAAA CGAGAATGCT GCAACCCGCG AGCGTATGAC TGCAGACTTG 
GAGACGGCGC GCCAGGAGGC CGCAGATACG CGCAGCCGCC TTGAGGCGGA GCTGACCCGA 
CAGCGGGCGC AGACGGTGGA AACCGAGAGC CAATATCAGG CCCAACTGCG CGCCGCCCAA 
GAGAGTTTTG ACGCCGAGCG CCGCGCGTTG GAAGATCGCC TTGCGACCCT CGAGGCACAG 
GCCGATACCA CGCGGCGTGA CCTGGAAGAC CAGCTTGCCG CGCTGCGTGG TCAGGCAGAA 
GAAACCCGCA GTGGGCTTGA AACGCGTTTG GCGCGTGCCG AGGCCGATCT GGCTGCAGCC 
CGCGCGGCTG CGAGTTCCAC CGCAGAGGAA CGCGCTTCGG TTGAACAGCG TTTGCTCATC 
GCGCTTGAGG CGCTGGAACG GGCGCAGGCT GCGGCAAGCG ATCAGGAGGT TCTGCAGAGC 
CGTCTTCTGG CCGCCTTGGC GCAAAAAGAT GATTTTGCAC AGGAGATTTC CGAACAGCGC 
ACCCTCGCAG AACAGCGCGC GGATCTCTTG GCGCAGGCCC GCGCTGCACT TGCGGAGGAA 
AAACAGATCT CGGAAGACGC CCGCCGCGAG ACGGCCTTGC TCAATCAGCA GGTGGCGGCG 
CTGCGTGAAC AGCTTGGTGG GCTGCAGTCG CTCCTGGACG ATTTCAAAGA ACGGGACGCA 
GCACAGGGAA TTCAGCTCCA GAGCCTGGGT CAGGATCTCA ATACAGCGCT TGCGCGTGCC 
GCCGCTGAAG AGCGCCGCCG CCGCATGCTC GAAGAACAGG AGCGCAAACG TCTTGAGGCA 
GAGCGCGAAC GTCTCGCCAA TGAAGCCAAG GATCTGGAGC AATATCGCTC CGAGTTCTTT 
GGTCAGTTGC GCAGCGTCCT GGGCAATCAG GAAGGTGTAC GCATCGAAGG CGACCGTTTT 
GTCTTTGCCT CCGAGGTGCT GTTTGCACTG GGAAGCGCCG AGCTCTCAGA GGCCGGCAAG 
GCCGAAATCG CCAAGGTGGC GCGCATCCTG CAAAACGTCG CCGCCGCCAT CCCGGATGAC 
ATCAACTGGA TCATCCGTGT GGATGGGCAC ACGGACAACC AGCGCTTTGT TGGGGCGGGC 
AAATACGCCG ACAACTGGGA GCTGAGCCAG GGCAGGGCGC TTTCGGTTGT GCGCTACATG 
ATTGATGAGC TGGGCATCCC CCCGGGACGT CTTGCGGCCA ACGGATTTGG CGAGTTCCAG 
CCGGTCAATC CAGCTGACAC GCCTGAGGCG CGCGCGCAGA ACCGCCGAAT CGAATTGAAG 
CTTACGGAAC GCTGA

Protein sequence

MALKRRTGQR FQGSIWPGFV DAMTGLLLVL MFVLTIFMVV QFVLRETISG QESELDELST 
EVRALAEALG VKEREASQLQ ARLGALGATL SSTRSDLDAA REQISNQTAR ISALTQERDA 
ARSDLATART QISDFEAQVA ALIAGRESAE AQIADLTAER DALDAARSEL LSEQEALNLA 
LAQLREEVDA EAEAARLAAA QTEALQALVE DLRAEGAAQS ERVSALEEAL SEEEATRLAE 
AAAAEALRAR LENADAELTA MTLALEEERK KAEDTLTLLA AAEAARDQLD TELEEALAAI 
EQAKAQVNDR DELAERLTRV LAQMEVTEST ATARVSALEA ELERVRNENA ATRERMTADL 
ETARQEAADT RSRLEAELTR QRAQTVETES QYQAQLRAAQ ESFDAERRAL EDRLATLEAQ 
ADTTRRDLED QLAALRGQAE ETRSGLETRL ARAEADLAAA RAAASSTAEE RASVEQRLLI 
ALEALERAQA AASDQEVLQS RLLAALAQKD DFAQEISEQR TLAEQRADLL AQARAALAEE 
KQISEDARRE TALLNQQVAA LREQLGGLQS LLDDFKERDA AQGIQLQSLG QDLNTALARA 
AAEERRRRML EEQERKRLEA ERERLANEAK DLEQYRSEFF GQLRSVLGNQ EGVRIEGDRF 
VFASEVLFAL GSAELSEAGK AEIAKVARIL QNVAAAIPDD INWIIRVDGH TDNQRFVGAG 
KYADNWELSQ GRALSVVRYM IDELGIPPGR LAANGFGEFQ PVNPADTPEA RAQNRRIELK 
LTER