Gene Ava_4408 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4408
Symbol	trpD
ID	3680535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	5526446
End bp	5527534
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	46%
IMG OID	637719761
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_324901
Protein GI	75910605
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.289652
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACTT CCCCAATCCC TACCCAAGAA TCTTCTACTA GTTGGTATCT TCTACTGCAA 
CAATTAATAG ATGGTGAATC TTTAAGTCGA TCGCAAGCTG CTGAATTGAT GCAAGGTTGG 
CTTAGTGAAG CCGTACCTCC AGAGTTATCA GGAGCAATCT TAACAGCACT CAACTTTAAA 
GGCGTTTCTG CCGATGAGTT GACTGGTATG GCTGAAGTAC TACAATCTCA ATCTAAATTG 
GGGAGTGGAG AAAATTCTTC CCAATTACCC ATTACCAATT ACCAATTCCC CATAATCGAT 
ACTTGTGGCA CTGGTGGCGA CGGGTCATCA ACTTTTAACA TTTCTACTGC TGTGGCGTTT 
GTGGCGGCTG CTTATGGTGT ACCTGTTGCC AAGCATGGTA ATCGTTCGGC TTCGAGTTTG 
ACGGGTAGTG CCGATGTTTT AGAAGCTCTG GGTGTTAACT TGGGTGCTTC TAGTGAAAAA 
GTACAAGCTG CTCTGCAAGA AGTCGGGATC ACATTTTTGT TTGCTCCCGG TTGGCATCCT 
GCATTAAAAG CGGTGGCTAC TTTGCGACGG ACTTTAAGAA TCCGCACGGT GTTTAATTTG 
CTGGGGCCGT TGGTCAATCC TTTGCGTCCC ACAGGACAAG TGGTGGGGTT ATTTACTCCC 
AAACTTTTGA CAACTGTTGC CCAAGCTTTA GATAATTTGG GTAAGCAAAA GGCGATCGTC 
TTACATGGAC GAGAAAGGCT GGATGAGGCT GGGTTGGGTG ATTTAACTGA CTTAGCAGTA 
TTATCTGATG GTAAGCTACA GTTAACTACG ATAAATCCCC AGGAAGTGGG TGTGACACCT 
GCTCCTATTG GCGCACTCCG GGGTGGGGAT GTACAAGAAA ATGCGGAGAT TCTCAAAGCT 
GTATTGCAAG GCCAAGGAAC CCAAGCACAA CAGGACGCTG TAGCTTTAAA CGCGGCTTTG 
GCGCTACAGG TGGCGGGTGC AGTCCCATTA TTAGACCATG CCAAAGGTGT GAGTGTAGCT 
AAGGAGATCC TACAGACTGG TACTGCTTGG GCAAAATTGG AACAATTGGT ACACTTTCTG 
AAGAGTTAG

Protein sequence

MTTSPIPTQE SSTSWYLLLQ QLIDGESLSR SQAAELMQGW LSEAVPPELS GAILTALNFK 
GVSADELTGM AEVLQSQSKL GSGENSSQLP ITNYQFPIID TCGTGGDGSS TFNISTAVAF 
VAAAYGVPVA KHGNRSASSL TGSADVLEAL GVNLGASSEK VQAALQEVGI TFLFAPGWHP 
ALKAVATLRR TLRIRTVFNL LGPLVNPLRP TGQVVGLFTP KLLTTVAQAL DNLGKQKAIV 
LHGRERLDEA GLGDLTDLAV LSDGKLQLTT INPQEVGVTP APIGALRGGD VQENAEILKA 
VLQGQGTQAQ QDAVALNAAL ALQVAGAVPL LDHAKGVSVA KEILQTGTAW AKLEQLVHFL 
KS