Gene Lferr_2844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lferr_2844
Symbol	trpD
ID	6878848
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 53993
Kingdom	Bacteria
Replicon accession	NC_011206
Strand	-
Start bp	2825241
End bp	2826257
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	64%
IMG OID	642790698
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_002221236
Protein GI	198284915
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.118515
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGTCC GGGACATACT GGAGCAAATC GTGGCGGGGC AGGACTTGTC GCGCAAAGAG 
ACGGAAACGG TCTTCGCCGC TATCATGGCC GGAGCATGGA CTCCCGCGCA GATCGGTGCT 
CTGCTCATGG GACTCCGCAT GAAGGGGCAG CGGGTCGAGG AACTGGTGGG CGCCACCCAG 
GCTTTGCGCG CCTGTATGAC GCGGGTAGAA GTCTCTACCG ATCACCTGCT GGATACCTGC 
GGTACCGGCG GTGACGCACT GAGCACCTTC AACATATCGA CGGTGTCTGC GGTGGTGGCG 
GCGGCCGGCG GGGCGCGGGT GGCCAAACAC GGCAACCGTT CCATGGTCAG CCGCAGCGGC 
AGCGCTGACG TGCTGGAAGC CGCGGGTCTG CGCATGGACA TGAGCCCCGC AGAAGTCGCC 
GACAGTATCG AGCGCATCGG TATCGGTTTT CTATTCGCGC CGGCGCACCA TGGCGCCATG 
CGTTATGCCG TTGGTCCGCG CAAGGAGCTC GCCATCCGTT CGTTGTTCAA CCTCATGGGA 
CCACTGAGCA ACCCGGCGGG GGCGCCGCAT CAGGTACTCG GCGTTTATGC CGAGCGCTGG 
CTGATTCCCA TGGCCGAAGC CGCCCGGGAA CTGGGATCAC GCCATGTGCT GGTGGTACAT 
GGGCACGATG GCCTGGATGA GATCAGCCTG TCCGGGCCAT CAGACATAGC GGAGTTAAAG 
GACGGGATGA TCAGTCGCAG CCGGATTCAG CCGGAGGACT TCGGGCTGTC ATCAGCACCG 
CTGGCGACCC TGCAAATCGA CAGCGTGGCG GCCGCTCTGG CGGCGGCGGA AGAAGTATTG 
CAGAATCGCC CCGGCCCGCG TCGTGACGTA GTTCTGCTCA ATGCCGGGGC CGCCCTCTAT 
GCGGCGGACG TGGTCCCCGA TATGGCGGTG GGCGTGGTGG TCGCCCGGGC TGTGCTCAAA 
TCCGGCGCCG CCTGGGATAA GTGGCAGGCT TTGTTGGGCA GGACTTCACA GGGATAA

Protein sequence

MIVRDILEQI VAGQDLSRKE TETVFAAIMA GAWTPAQIGA LLMGLRMKGQ RVEELVGATQ 
ALRACMTRVE VSTDHLLDTC GTGGDALSTF NISTVSAVVA AAGGARVAKH GNRSMVSRSG 
SADVLEAAGL RMDMSPAEVA DSIERIGIGF LFAPAHHGAM RYAVGPRKEL AIRSLFNLMG 
PLSNPAGAPH QVLGVYAERW LIPMAEAARE LGSRHVLVVH GHDGLDEISL SGPSDIAELK 
DGMISRSRIQ PEDFGLSSAP LATLQIDSVA AALAAAEEVL QNRPGPRRDV VLLNAGAALY 
AADVVPDMAV GVVVARAVLK SGAAWDKWQA LLGRTSQG