Gene TM1040_3213 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3213
Symbol
ID	4075317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	+
Start bp	208049
End bp	209620
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	60%
IMG OID	638004722
Product	hypothetical protein
Protein accession	YP_611449
Protein GI	99078191
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase]
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.628959
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAACAG TCGGACACGC CTTGGCACAA ACCCTTGTTG AGCAGGGCAC CGAGATCATC 
TTTGGCATCC CCGGCGTGCA CACCATCGAG CTCTATCGTG GCATCGAAGG CGCAGGTATC 
CGTCATATCA CACCGCGTCA TGAACAGGGT GCGGGATTTA TGGCAGACGG ATATGCCCGT 
ATCGCTGGCA AGCCCGGCGT TGTCTTCGTG ATCACCGGAC CGGGTTTGAT CAACACGTTG 
ACCCCGATGG CGCAGGCCCG CGCGGACAGC ATTCCAATGA TCGTGGTCAC CGGCGTCAAC 
CGGCGCGACA GTCTTGGCAA GGGTCTCGGC CTCTTGCATG AGTTGCCAGA TCAACTGGGT 
CTGTCGCAAA CGATATCCAA ACATGCCGAG CAAGTCGAAG ACGCATCGGC GCTCGAAGGG 
GTGATGGCCC GCGTGTTTGG CGCTCTTCAA GGGCGCCCTG CCCCGGTCCA CGTCGAAGTG 
CCGACGGACG TCATGACCCT ACCGGCGTCC GAAACGGTGA CGATCCCGGA TCCAGAGCCA 
AAGGCTGCAA GCGATCTGAC TCCGATCCTG GATGCCCTGG CCCGATGCGA GAGTCCTGTG 
ATCCTCGCGG GGGGCGGCTG CCGCACGCAG AACCTTGCGC TCTTGAAACT GGCACAAAGG 
CTCGATGCGC CCGTCGTCCA GACCGTGAAT GCGCGTGGCC TGATGCATGC ACATCCCCTG 
ACGGTTCCAG CCAGTCCGTC CCTTCAATCG GTGCGAGATC TCATTGCGGA AGCGGATTGT 
GTTCTGGCTC TTGGAACCGA AATGGGGCCA ACCGACTACG ACATGTATGC GACCGGGACC 
TATCCGGAGA TGAGCAACCT TCTGCGGATC GACATTTGTG ACGATCAACT CTCGCGCCAT 
GAGGCTGCCT GCAGGCTCAC CGGGGATCTG AACGAAATTC TACCCGTTCT GGCCGAACAA 
TCCCCGGGAA AATCAAATGC GCGTGGATCT GAGCGTGCAG AAAAGGCGCG CCTTGCGGCG 
CGCGCCGAAA TCGAAGCGCT GACACCCGGG TATGCGCGTT TCGTATCGCA GATCGAGACG 
CTGAGGGATG CTTGTCCAGA CGCTATTTTT GTCGGGGATT CCACGCAAGC GGTCTATGCG 
GCCAACCTCT ATTATGACCA CAACCGCCCC GGAGGCTGGT TCAACGGCGC GACTGGTTTT 
GGGGCCCTCG GCTACGCAAT CCCCGCCGCG ATTGGCGCCG CTCTTGCCGA TCCATCGGCA 
CCGGTGGTCG CGCTGATGGG CGACGGCGGT GCGCAGTTCA CGCTGCCAGA GCTTGGCGTT 
GCCCGCGATG AAAACCTGCC CATCCTGTTT GTCGTCTGGA ACAACAATGC GTTCCTGGAA 
ATCTCGAACG CAATGGAGGC CGCAGGAATC TCTCCGACAG GCTGCCACCC TTCTGCACCT 
GATTTTGAGG CAGCTGCCGC CGCATACCGG CTCGATTTTC GGCGGATCGC ACCAGAGCAA 
CTTCAGAACG CGTTGTCCGA GATCCTCCCA CTCAATGGTC CGATGCTGCT CGAGATCGAT 
ATGACGGGCT AG

Protein sequence

MRTVGHALAQ TLVEQGTEII FGIPGVHTIE LYRGIEGAGI RHITPRHEQG AGFMADGYAR 
IAGKPGVVFV ITGPGLINTL TPMAQARADS IPMIVVTGVN RRDSLGKGLG LLHELPDQLG 
LSQTISKHAE QVEDASALEG VMARVFGALQ GRPAPVHVEV PTDVMTLPAS ETVTIPDPEP 
KAASDLTPIL DALARCESPV ILAGGGCRTQ NLALLKLAQR LDAPVVQTVN ARGLMHAHPL 
TVPASPSLQS VRDLIAEADC VLALGTEMGP TDYDMYATGT YPEMSNLLRI DICDDQLSRH 
EAACRLTGDL NEILPVLAEQ SPGKSNARGS ERAEKARLAA RAEIEALTPG YARFVSQIET 
LRDACPDAIF VGDSTQAVYA ANLYYDHNRP GGWFNGATGF GALGYAIPAA IGAALADPSA 
PVVALMGDGG AQFTLPELGV ARDENLPILF VVWNNNAFLE ISNAMEAAGI SPTGCHPSAP 
DFEAAAAAYR LDFRRIAPEQ LQNALSEILP LNGPMLLEID MTG