Gene Avin_02120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_02120
Symbol	trpB
ID	7759173
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	205981
End bp	207201
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	66%
IMG OID	643803137
Product	tryptophan synthase subunit beta
Protein accession	YP_002797448
Protein GI	226942375
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAGA CTTCCTACCG CACCGGCCCC GACGAAAAAG GCCTGTTCGG CCGTTTCGGC 
GGCCAGTACG TCGCCGAAAC CCTGATGCCG CTGATCCTCG ACCTGGCCGA GGAATACGAG 
AGGGCCAAGG TTGATCCGGC CTTCCTCGAA GAACTGGCCT ACTTCCAGCG CGACTACGTC 
GGCCGGCCGA GCCCGCTGTA TTTCGCCGAG CGCCTGACCG AGCACTGCGG CGGCGCGAAG 
ATCTACCTCA AGCGCGAAGA GCTGAACCAC ACCGGCGCGC ACAAGATCAA CAACTGCATC 
GGGCAAATCC TGCTGGCCCG GCGCATGGGC AAGCAGCGCA TCATCGCCGA GACCGGCGCC 
GGCATGCACG GCGTGGCCAC CGCCACCGTG GCCGCGCGCT TCGGCCTGCA GTGCGTGATC 
TACATGGGCA CCACCGACAT CGATCGCCAG CAGGCCAACG TCTTCCGCAT GAAGCTTCTT 
GGCGCCGAGG TGATCCCGGT CACCGCCGGC ACCGGCACCC TCAAGGACGC CATGAACGAG 
GCCCTGCGCG ACTGGGTGAC CAACGTCGAG ACCACCTTCT ACCTGATCGG CACCGTGGCC 
GGCCCGCATC CGTACCCGGC GATGGTCCGC GATTTCCAGG CGGTGATCGG CAAGGAAACC 
CGCGAGCAAC TGATCGAGAA GGAAGGGCGC CTGCCCGACT CGCTGGTCGC CTGCATCGGC 
GGCGGCTCCA ACGCCATGGG CCTGTTCCAC CCCTTCCTCG ACGAGCCGGG CGTGAAGATC 
GTCGGCGTCG AGGCCGCCGG CCACGGCATC GAGACCGGCA AGCACGCGGC CAGCCTGAAC 
GGCGGCGTGC CCGGCGTGCT GCACGGCAAC CGCACCTTCC TGCTGCAGGA CGCCGACGGC 
CAGATCATCG ACGCCCACTC GATCTCCGCC GGCCTCGACT ACCCCGGCAT CGGCCCGGAA 
CATGCTTGGC TACACGACAT CGGCCGCGTC GAGTACAGCT CGATCACCGA CCATGAAGCG 
CTGCAGGCCT TCCATACCTG CTGTCGCCTG GAGGGCATCA TCCCGGCGCT GGAGTCGTCC 
CATGCCCTGG CCGAAGTGTT CAAGCGCGCG CCCCGGCTTC CGAAAGACCA CCTGATGGTG 
GTCAACCTCT CCGGCCGCGG CGACAAGGAC ATGCAGACCG TGATGCATCA CATGCAGGAA 
AAACTGGAGA AGCACGCATG A

Protein sequence

MTETSYRTGP DEKGLFGRFG GQYVAETLMP LILDLAEEYE RAKVDPAFLE ELAYFQRDYV 
GRPSPLYFAE RLTEHCGGAK IYLKREELNH TGAHKINNCI GQILLARRMG KQRIIAETGA 
GMHGVATATV AARFGLQCVI YMGTTDIDRQ QANVFRMKLL GAEVIPVTAG TGTLKDAMNE 
ALRDWVTNVE TTFYLIGTVA GPHPYPAMVR DFQAVIGKET REQLIEKEGR LPDSLVACIG 
GGSNAMGLFH PFLDEPGVKI VGVEAAGHGI ETGKHAASLN GGVPGVLHGN RTFLLQDADG 
QIIDAHSISA GLDYPGIGPE HAWLHDIGRV EYSSITDHEA LQAFHTCCRL EGIIPALESS 
HALAEVFKRA PRLPKDHLMV VNLSGRGDKD MQTVMHHMQE KLEKHA