Gene Ava_2639 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_2639
Symbol
ID	3681941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	3267459
End bp	3268529
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	44%
IMG OID	637717985
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_323148
Protein GI	75908852
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.997652
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATACAAA ATGATACAGA ACTATTGACA ACATCTGGTG CGGCTGTACC TATTCTGATT 
ACGGGTGGTG CAGGCTTTAT TGGCTCCAAT TTCGTCCATC ATTGGTATGA ACAGTACCCA 
GGCGATCGCA TAATTGTTTT GGATGCGCTC ACCTATGCAG GGAATCGCCA AAATTTAGCA 
GATATAGAAG GAAAAGCAAA TTTAAGATTT GTCAAGGGAG ATATAGGTGA TCGCGCTCTC 
ATTGATCAGC TACTAGAGGA AGAAAAGATT CAGGCGATCG CCCACTTTGC AGCTGAATCT 
CACGTTGATC GCTCAATTGT CGCGCCAGAT GCTTTCATTC AGACCAATGT TGTAGGTACA 
TTTACTTTAT TAGAAGCCTT TCGCCATCAC TGGACAAAAC AAGGCAAACC TGCTAACTAC 
CGCTTTCTCC ACGTCTCTAC AGATGAAGTT TACGGCAGCC TTGAACTAGA TGATCCAGCT 
TTTACAGAAA CAACTCCTTA CGCCCCCAAC AGTCCCTATT CCGCCTCTAA AGCAGGTAGT 
GATCATCTAG CACGAGCTTA TTACCACACC TACGGTTTAC CAACCTTAAT TACAAATTGC 
TCCAATAACT ACGGCCCCTA TCACTTCCCC GAAAAATTAA TTCCCCTAAT ATGCCTCAAT 
ATTCTCTTAG GTAAACCTCT ACCTATCTAT GGAGATGGGT TAAATATCCG TGATTGGTTA 
TATGTTGAAG ACCATTGTCG TGCTTTAGAT ATTGTCATTC ATCAGGGTAA ACCAGGAGAA 
ACCTACAACA TTGGCGGTAA TAACGAAATC AAAAACATTG ACCTTGTTCA GATGATCTGT 
GAGTTAATGG ACGAATTAGC CCCTGATTTA CCCGTCTCTC CCGCCAGTAA ACTCATTACC 
TTCGTCAAAG ACCGCCCCGG ACACGATCGC CGTTATGCGA TCGATGCGAC AAAAATCAAA 
ACAGAATTAG GTTGGGAACC CCAACAAACA ATCTCGACTG GATTACGCCA CACCATCCAG 
TGGTATCTAA CTCATCGCCA TTGGTGGGAA GCACTTTTAC CAAAGGAGTA G

Protein sequence

MIQNDTELLT TSGAAVPILI TGGAGFIGSN FVHHWYEQYP GDRIIVLDAL TYAGNRQNLA 
DIEGKANLRF VKGDIGDRAL IDQLLEEEKI QAIAHFAAES HVDRSIVAPD AFIQTNVVGT 
FTLLEAFRHH WTKQGKPANY RFLHVSTDEV YGSLELDDPA FTETTPYAPN SPYSASKAGS 
DHLARAYYHT YGLPTLITNC SNNYGPYHFP EKLIPLICLN ILLGKPLPIY GDGLNIRDWL 
YVEDHCRALD IVIHQGKPGE TYNIGGNNEI KNIDLVQMIC ELMDELAPDL PVSPASKLIT 
FVKDRPGHDR RYAIDATKIK TELGWEPQQT ISTGLRHTIQ WYLTHRHWWE ALLPKE