Gene Avin_20090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_20090
Symbol	tyrB
ID	7764122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	1996152
End bp	1997348
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	67%
IMG OID	643804907
Product	aromatic amino acid aminotransferase
Protein accession	YP_002799190
Protein GI	226944117
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1448] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCTGT TCTCTGCCGT AGAAATGGCA CCGCGTGACC CGATCCTTGG CCTCACCGAA 
GCATTCAATG CCGATATCCG TCCGACCAAG GTCAACCTCG GCGTCGGCGT CTACTACAAC 
GAAGAGGGTC GAATTCCCCT GCTGCGCGCC GTCGAGGAAG CCGAAAAGGC TCGCATCGCC 
GCCCATGCAC CGCGCGGCTA CCTGCCGATC GAGGGCATCG GTGCCTACGA CCAGGCGGTG 
CAGAGGCTGC TGTTCGGCAA CGACTCCGCC CTGCTCGCCG ACGGCCGTGT GGTCACCGCT 
CAGGCGCTGG GCGGCACCGG CGCGCTGAAG GTCGGCGCCG ACTTCCTCAA GCGCCTGCTG 
CCGGATGCCG TGGTCGCCAT CAGCGACCCG AGCTGGGAGA ACCACCGCGC CCTGTTCGAG 
TCCGCCGGCT TCCGCGTGCA GAGCTACCGC TACTACGACG CCGCCGGCCA CGGCCTGAAC 
CGCGCCGGCA TGCTCGAAGA CATCCGGGCC CTGCCGGCCG GCTCCATCGT GCTGCTGCAC 
GCCTGCTGCC ACAACCCGAC CGGCGTCGAT CTGTCCATCG ATGACTGGAA GCAGGTGCTG 
GAGGCGATCC GCGAACGCGG CCATGTCCCC TTCCTCGACA TCGCCTACCA GGGCTTCGGC 
GACAGCATCG AGGAAGATGC CGCGGCGGTT CGCCTGTTCG CCGGCTCGGA CCTGCAGTTC 
TTCGTCTCCA GCTCCTTCTC CAAGTCCTTC TCCCTCTACG GCGAACGGGT CGGCGCCCTG 
TCCATCGTCG CCGCCTCGAA GGACGAGGCG GCTCGCGTGC TGTCGCAGAT CAAGCGGGTG 
ATCCGCACCA ACTATTCGAA CCCGCCGACC CACGGCGCCA GCGTGGTGTC CAGCGTGCTC 
AACAGTCCGG AACTGCGCGC CCTGTGGGAA AGCGAACTGG CCGAGATGCG CGGCCGCATC 
CAGAGCATGC GCCAGGCCAT GGTCGAGCAA CTGGCCGCCC AGGGCGCCAA GCGCGACTTC 
TCCTTCGTCG CCCGGCAGCG TGGCATGTTC TCCTACTCCG GTCTCAGCGT CGCGCAGGTG 
GAACGGCTGC GCACCGAGTT CGGCATCTAC GCCGTCGCCA CCGGCCGCAT CTGCGTCGCC 
GCCCTGAACC AGCGCAACAT CGCCAGCGTC ACCCAGGCCA TCGCTCAGGT GCTCTGA

Protein sequence

MSLFSAVEMA PRDPILGLTE AFNADIRPTK VNLGVGVYYN EEGRIPLLRA VEEAEKARIA 
AHAPRGYLPI EGIGAYDQAV QRLLFGNDSA LLADGRVVTA QALGGTGALK VGADFLKRLL 
PDAVVAISDP SWENHRALFE SAGFRVQSYR YYDAAGHGLN RAGMLEDIRA LPAGSIVLLH 
ACCHNPTGVD LSIDDWKQVL EAIRERGHVP FLDIAYQGFG DSIEEDAAAV RLFAGSDLQF 
FVSSSFSKSF SLYGERVGAL SIVAASKDEA ARVLSQIKRV IRTNYSNPPT HGASVVSSVL 
NSPELRALWE SELAEMRGRI QSMRQAMVEQ LAAQGAKRDF SFVARQRGMF SYSGLSVAQV 
ERLRTEFGIY AVATGRICVA ALNQRNIASV TQAIAQVL