Gene Ava_4076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4076
Symbol
ID	3681599
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	5064653
End bp	5065732
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	43%
IMG OID	637719427
Product	homoserine O-acetyltransferase
Protein accession	YP_324575
Protein GI	75910279
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.66182
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.370681
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTACC AGGACTTCAT TTCAGAACAA ACTGAGTATT ATCATTTACC AGTGCCATTT 
GAGTTAGAAG GCGGCGGGGT TTTAACTGGG GTTCAGGTCG CTTATCGGAC TTGGGGAAAG 
TTAAACTCAG CAGGTGATAA TGGAGTACTG ATTTGTCATG CTTTAACTGG TTCTGCTGAT 
GCTGACGAAT GGTGGGAAGG TTTGTTGGGT GCAAACAAAG CACTAGATAG CGATCGCGAT 
TTTATTATAT GCAGTAATAT TTTGGGCAGT TGCTACGGTA CAACAGGAGC AACGAGCATC 
AATCCCCAAA CTGGAATCCC TTACGGTGCA TCATTTCCAG CAATTACAAT TCGGGATATG 
GTGCGCTTAC AAGCTGCACT GATTCAACAT CTGGGAATTA AATCTTTACA GTTAGTTATT 
GGTGGCTCAC TGGGTGGGAT GCAGGTACTA GAGTGGGCGT TACTATATCC AGAAATTGTA 
CAAGCGATCG CACCCATTGC TACTTCCGGT AGACACTCAG CTTGGTGTAT CGGCTTGAGT 
GAAGCCCAAA GACAAGCTAT TTATGCTGAT CCCAACTGGA AGGGGGGTAA CTACACAAAA 
GAACAACCAC CCAGCCAAGG CTTAGCGGTA GCACGGATGA TGGCGATGAG TGCTTATCGT 
TCTTGGCAAA GCTTTACAGC ACGTTTTGGA AGACAATATG ATGCTGTGGC CGATCAATTT 
GCGATCGCTA GTTATCTACA ACATCATGGT CAAAAGCTAG TGCAGAGATT TGATGCTAAC 
ACTTACATCA CTCTCACCCA AGCGATGGAT AGCCATGATG TTGCTCAAGG TCGAGACTAT 
AAATCTGTTT TGCAAAGCAT TAAACAACCT GCTTTAGTTG TGGCTATTGA TTCTGATATT 
CTTTATCCGC CGACAGAACA ACAAGAACTC GCAGATTTCA TTCCTGATGC TCAACTAGGT 
TGGCTACAAT CCAGTTATGG TCACGATGCT TTTTTAATTG ATATAGCCAC CCTCAGTCAG 
CTAGTGATTA ACTTTCGACA ATCTTTAAGT TTAAAAACCT TTTCTGATGT GACAACCTAG

Protein sequence

MNYQDFISEQ TEYYHLPVPF ELEGGGVLTG VQVAYRTWGK LNSAGDNGVL ICHALTGSAD 
ADEWWEGLLG ANKALDSDRD FIICSNILGS CYGTTGATSI NPQTGIPYGA SFPAITIRDM 
VRLQAALIQH LGIKSLQLVI GGSLGGMQVL EWALLYPEIV QAIAPIATSG RHSAWCIGLS 
EAQRQAIYAD PNWKGGNYTK EQPPSQGLAV ARMMAMSAYR SWQSFTARFG RQYDAVADQF 
AIASYLQHHG QKLVQRFDAN TYITLTQAMD SHDVAQGRDY KSVLQSIKQP ALVVAIDSDI 
LYPPTEQQEL ADFIPDAQLG WLQSSYGHDA FLIDIATLSQ LVINFRQSLS LKTFSDVTT