Gene TM1040_3466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3466
Symbol
ID	4075100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	489983
End bp	491395
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	63%
IMG OID	638004975
Product	aromatic-L-amino-acid decarboxylase
Protein accession	YP_611700
Protein GI	99078442
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0076] Glutamate decarboxylase and related PLP-dependent proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.811665
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTGGA CCGATTTTGC ATCCTGGGGC CGCAAGGTCG CCGATTGGGC GCAGGACTAT 
CACCTCACCG TGGGCGAGCG CCCGGTGCGC GCGCAGACCA AACCCGGTGA TATGCTGACC 
GCCCTGCCCG AAACACCGCC GGAACAGGGC GAGGGGATGG AGACGATCTT TGCCGATTTT 
GAGGAAAAGG TGATGCCCGG CATCACCCAT TGGCAGCACC CGCGCTTCTT TGCCTATTTC 
GCCTCCAACG CCGCCGCGCC CTCGGTGCTG GCGGAATTCC TGACCTCCGC CATCGCGCCG 
CAATGTATGC TCTGGCAGAC CTCTCCGGCG GCGACCGAGA TGGAGACCCG GATGATGGAC 
TGGCTGCGCC AATCCCTTGG CCTGCCGAGC GAATTTCGCG GCGTCATTCA GGACAGCGCC 
TCTTCGGCGA CCCTTGCTGC GGTGCTCACC ATGCGCGAAC GGGCCTTGAA CTGGCAGGGC 
AATCAACAGG GGCTCGCGGG CCAGCCGACC TTGCGGATCT ATTGTTCGTC CGAGGTGCAC 
ACCTCGGTGG ACCGTGCGAT CTGGGTTGCG GGCATCGGTC AGGCCAACCT CGTGCGCGTA 
CCCATCAAGG GCGACTGGCG CGGCATGGAT CCCGCAGCGC TTGAGACTGC GATCCAGTCG 
GACAAGGCCG CAGGCCTTCA ACCCGCTGGC GTCATCCTCT GTGTGGGCGG CACCGGCACC 
GGCGCCACGG ACCCCATCGC GGACTGCATC AAGGTGGCGC AGAATCATGG GCTTTATACC 
CATGTGGACG CGGCATGGGC CGGTTCCGCG ATGATCTGCC CGGAGTTCCG CGCGTATTGG 
CCGGGCATTG AGGGCGCAGA CAGCATCGTT TTCAATCCGC ATAAATGGCT CGGCGCGCAG 
TTTGATTGCT CGGCGCATTT CCTTAAGAAC GCGGACGATC TGGTGCGCAC CCTCGCCATC 
AGCCCGGAAT ACCTCAAGAC CCACGGTCAC GACGGCATCA TCAACTATTC CGAATGGTCG 
GTCCCCCTGG GCCGCCGCTT CCGCGCGCTA AAGATCTGGT TCCTGATCCG CACCTATGGC 
CTTGAAGGAT TGCGCCAACG CATCCGCAAT CACGTTGCAT GGTCGCGCCA GCTTCACGAC 
GCGCTTGCGC AAGAGCCGGA TTTTGAAATC GTCACCCCGC CGATGTGGTC GCTCTGGACC 
TTCCGCTACG CGCCTGATGG GGCCACGGAT CTCGATGCGC TGAACCTCGA ACTCGTGAAC 
AGGATCAACG ACGACGGCCG CATCTACCTC ACCCAGACCC GCGTGGACGG CGTGCTGGTG 
ATCCGGTTTC AGGCGGGCGC GTTTGAAACC ACCGAGGCTG ACATCATGCT CGCCCATGAT 
GTGATCACAG AAATCGCAAG AGGACTGACC TGA

Protein sequence

MNWTDFASWG RKVADWAQDY HLTVGERPVR AQTKPGDMLT ALPETPPEQG EGMETIFADF 
EEKVMPGITH WQHPRFFAYF ASNAAAPSVL AEFLTSAIAP QCMLWQTSPA ATEMETRMMD 
WLRQSLGLPS EFRGVIQDSA SSATLAAVLT MRERALNWQG NQQGLAGQPT LRIYCSSEVH 
TSVDRAIWVA GIGQANLVRV PIKGDWRGMD PAALETAIQS DKAAGLQPAG VILCVGGTGT 
GATDPIADCI KVAQNHGLYT HVDAAWAGSA MICPEFRAYW PGIEGADSIV FNPHKWLGAQ 
FDCSAHFLKN ADDLVRTLAI SPEYLKTHGH DGIINYSEWS VPLGRRFRAL KIWFLIRTYG 
LEGLRQRIRN HVAWSRQLHD ALAQEPDFEI VTPPMWSLWT FRYAPDGATD LDALNLELVN 
RINDDGRIYL TQTRVDGVLV IRFQAGAFET TEADIMLAHD VITEIARGLT