Gene TM1040_3495 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3495
Symbol
ID	4075174
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	+
Start bp	531293
End bp	532558
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	62%
IMG OID	638005010
Product	diaminopimelate decarboxylase
Protein accession	YP_611729
Protein GI	99078471
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0019] Diaminopimelate decarboxylase
TIGRFAM ID	[TIGR01048] diaminopimelate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.844313
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCATT TTCTCTATCG CGATGGCGCT TTGTACGCCG AAGATGTCCC CGTAGCCGAG 
ATTGCCGCTA CGGTGGGCAC GCCGTTCTAC GTCTACTCCA CCGCGACGCT CCTGCGCCAT 
TTCCGTCTCT TTGACGAGGC GCTTGAGGGC ACCGACCATC TGGTTTGTTA CGCGATGAAG 
GCCGCCTCCA ATCAGGCGAT CCTAAAGACA CTCGCGGCGG CGGGCGCAGG CATGGATGTG 
GTGAGCGAAG GCGAATACCG CCGCGCCAAG GCCGCAGGCG TGCCGGGCGA CAAGATCGTG 
TTTTCCGGTG TCGGCAAGAC CGCCGAAGAG ATCCGCACCG CGCTCACCGG GGGCATTCGC 
CAGTTCAACG TCGAATCCGA GCCCGAGATG GACGTGATCA ATGCCGTTGC GCTCGAGCTT 
GGTGTCACCG CGCCGATCAC CGTGCGGGTG AACCCGGATG TGGATGCAAA GACCCACGCC 
AAGATCGCGA CCGGTAAATC CGAGAACAAA TTCGGCATCC CCATCGCCAA GGCGCGCGCG 
GTCTATGCCC ATGCCGCCAG CCTGCCGGGC CTTGAGGTGA TCGGGATCGA TGTTCACATC 
GGCTCGCAAC TCACGGATCT TGAGCCCTTC CGCCTTGCCT ATCAAAAGGT TGCGGAGCTG 
ACACAGGCTC TGCGCGCGGA CGGTCACGAT ATTCGCCGCC TTGATCTTGG GGGCGGTCTG 
GGCATCCCCT ATACCCGCTC CAATGAGGCC CCGCCGCTGC CGGTGGAATA TGGCCAGATG 
ATCAAGGAAG AGCTCGGTCA TCTGGGCTGC GAAATCGAGA TCGAACCGGG CCGTCTGGTG 
GCGGGCAATG CGGGGCTGAT GGTCTCTAAG GTGATCTACA TCAAAGAGGG CGAAGGCCGC 
GATTTCCTGA TCCTCGACGG GGCCATGAAC GACCTCATCC GCCCAGCGAT GTATGAGGCC 
CATCACGACA TCATCCCCGT GGTGGAACCG ACCCCCGGTC TCGAACCGCA ACCCTATGAC 
ATCGTGGGCC CGGTCTGCGA AAGCGGCGAC ACCTTTGCCA AACAACGCCT GATGCCGCCG 
CTTGCTGCGG GGGATCTGGT GGCGTTTCGC AGTGCCGGGG CTTATGGCGC GGTGATGTCC 
AGCGAATACA ACTCGCGCCC CCTCATCCCC GAGGTGCTGG TCCACGGCGA TCAATTTGCA 
GTCATCCGGC AGCGTCCGAC CTTTGACGAG ATGATAAATC GCGATACCAT CCCAGAGTGG 
CTGTAA

Protein sequence

MDHFLYRDGA LYAEDVPVAE IAATVGTPFY VYSTATLLRH FRLFDEALEG TDHLVCYAMK 
AASNQAILKT LAAAGAGMDV VSEGEYRRAK AAGVPGDKIV FSGVGKTAEE IRTALTGGIR 
QFNVESEPEM DVINAVALEL GVTAPITVRV NPDVDAKTHA KIATGKSENK FGIPIAKARA 
VYAHAASLPG LEVIGIDVHI GSQLTDLEPF RLAYQKVAEL TQALRADGHD IRRLDLGGGL 
GIPYTRSNEA PPLPVEYGQM IKEELGHLGC EIEIEPGRLV AGNAGLMVSK VIYIKEGEGR 
DFLILDGAMN DLIRPAMYEA HHDIIPVVEP TPGLEPQPYD IVGPVCESGD TFAKQRLMPP 
LAAGDLVAFR SAGAYGAVMS SEYNSRPLIP EVLVHGDQFA VIRQRPTFDE MINRDTIPEW 
L