Gene Ava_4386 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4386
Symbol	aroB
ID	3680572
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	5497082
End bp	5498173
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	44%
IMG OID	637719739
Product	3-dehydroquinate synthase
Protein accession	YP_324879
Protein GI	75910583
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00709401
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACTTCTG TAATTAATGT GAATCTACCA ACGCAGTCTT ATGAGATTGC GATCGCACCT 
GCAAGTTTAG ATCAGATTGG TCAAAGCTTG GCTGGGTTAA AACTGGGCAA GAAAGTATTA 
CTGGTTTCTA ATCCCACGAT TTTTAAGCAT TTTGGCAAAG TTGCGGTTGA TTCCTTAGAA 
GCTGCTGGAT TTCAAGTAGC AAGTTATTGC TTACCAGCAG GGGAACGCTA CAAAACCCTT 
AATTCTATTC AAAAACTCTA CGATATAGCC CTAGAAAATC GCCTAGAACG ATCCTCAACA 
ATGGTGGCTT TGGGGGGAGG GGTAATTGGT GATATGACTG GCTTTGCCGC CGCTACTTGG 
CTACGGGGGA TTAATGTAGT GCAAGTACCC ACCACACTCT TAGCAATGGT AGATTCGGCT 
ATTGGTGGTA AGACAGGTGT TAATCATCCC CACGGGAAAA ACTTGATTGG TGCGTTCCAT 
CAGCCGCGAT TTGTGTTAAT TGATCCCCAA GTACTAAAAA CCTTGCCTGT ACGAGAATTT 
CGCGCGGGAA TGGCAGAGGT AATTAAGTAT GGCGTGATTT GGGATGCAGA ATTATTCAAC 
CAGCTAGAAC AAAGTAAACG TCTCGACCAA CTGCGCTACA TCAAGCCAGA ATTGATGGAT 
GCTATCTTAA CTCGTTCATG TCAAGCCAAA GCTGATGTTG TCGGCAAAGA TGAGAAGGAA 
GGTGGACTGC GTGCGATTTT GAATTACGGA CACACCGTTG GTCACGCGGT GGAAAGCTTA 
ACTAACTATC GGCTACTCAA ACATGGTGAA GCAGTAGGTA TCGGCATGGT AGCGGCTGGG 
CAAATTGCTG TAAATTTAGG ACTGTGGCAA CAAGCAGATG CAGACCGTCA AAATGCCTTA 
ATTGAAAAGG CGGGTTTACC GACAAAGTTA CCAGCCGGAT TAGATATTGA AGGGATTATT 
GAGGCATTGC AATTAGATAA AAAAGTCAAA GATGGTAAAG TACGGTTTGT TTTACCAACT 
CAAATTGGTG TAGTGACAGT TACTGACGAG GTGACATCAG ATCACATTCG GCAAGTTTTA 
CAGCAGATGT AA

Protein sequence

MTSVINVNLP TQSYEIAIAP ASLDQIGQSL AGLKLGKKVL LVSNPTIFKH FGKVAVDSLE 
AAGFQVASYC LPAGERYKTL NSIQKLYDIA LENRLERSST MVALGGGVIG DMTGFAAATW 
LRGINVVQVP TTLLAMVDSA IGGKTGVNHP HGKNLIGAFH QPRFVLIDPQ VLKTLPVREF 
RAGMAEVIKY GVIWDAELFN QLEQSKRLDQ LRYIKPELMD AILTRSCQAK ADVVGKDEKE 
GGLRAILNYG HTVGHAVESL TNYRLLKHGE AVGIGMVAAG QIAVNLGLWQ QADADRQNAL 
IEKAGLPTKL PAGLDIEGII EALQLDKKVK DGKVRFVLPT QIGVVTVTDE VTSDHIRQVL 
QQM