Gene Ava_C0102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_C0102
Symbol
ID	3678057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007412
Strand	-
Start bp	124255
End bp	125811
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	47%
IMG OID	637715186
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_320380
Protein GI	75812763
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACTA CATACCATCA CAGTGCTGCT TTTGATTATA TTGTGATTGG CGCCGGTTCA 
GCAGGCTGCG TTGTTGCCAA CCGTCTTACA GAAGACCCTA ATACTAAAGT ATTGCTGCTC 
GAAGCGGGTG ATCCTGATAC CAAGCCAGAA CTTCAAGTTC CCTCATTGTG GCCTACTACA 
CTCTTAGGCT CGGAAGTGGA CTGGGCATAC TTAACTGAAG GGGAACCTTA CTTAAATAAC 
CGCAAAATTT TATCTTCACG CGGTAAAGTC TTGGGCGGCA GCAGTTCGAT TAATGGCATG 
ATTTATATAC GAGGCAATGA ACGTGACTAC AATAGCTGGC AAGCGTTAGG TAATATTGGT 
TGGAGTTATC AGGATGTCTT GCCTTACTTC AAGAAATCGG AAAACCAGCA GCGGGGAGCA 
TCGTTATTTC ACGGGGTTGA TGGACCACTT AGTATCACAG ATCCACTTTC TCCTGCAAAA 
GTGTCGCAAC GCTTTGTGGA AGCCGCGATC GCACAGGGCT ATGAGCAAAA TCCCGACTTT 
AATGGCGTAC AGCAGGAAGG TGCAGGACTT TACCAAGTGA CCGTGAAAGA TGGCAAGCGC 
CAAAGTACAG CAGTGGCATT TCTGCGTCCG ATTAAAGATC GCCCCAACTT GACCATTCAA 
ACAGGAGCAT TGGTGACTCG TTTACTCTTT GAGGGAAAGC GTGCAGTAGG GGTAGTGTAT 
GTTCAAAATG GAACGGAGTA TCAAATCAGG GTCAACTCCG AAGTGATTTT GAGTGCTGGC 
GCCTTCGATT CTCCTAAACT GCTCATGCTT TCTGGAATTG GACCTGCTGA ACATCTGCGG 
GCAGTAGGCA TTCCTGTAGT TTTTGATTTG CCGGGTGTCG GCCAGAATCT TCAAGATCAC 
CCACTTGCTG TTATTGCCTA CCAGTCTACT CAGGACGTAC CCCTTGCGCC AAGTAGTAAT 
GGGGGAGAGG CTGGGTTATT TCTGCATACC AACAATAATT TAGATGCGGC ACCTAATTTG 
CAATTTACAA TTGTTCCGAT TTTATATGTC GATCCTGCCT ATGCACGTGA AGGTCCGGGA 
TTCACCCTTA CCTTTTACAT CACCCGTCCC GAAAGTCGTG GTAGTGTAAG ACTACGTTCC 
TCCTCCCCCT TCGACCCACC GTTGATTCGC GTCAACTATC TTCAGAAAGA ATCTGACATG 
CAACTGATGG TTGAAGGACT TAAAATTTTG CGTCAAATTG TGTACTCCGA TGCGTTTAAT 
GAGTTTCGGG GTGAGGAAAT TGCTCCAGGG AGTTCCGTGC ATAGCGACAA AGCAATCGAA 
GATTATATTC GGCAAACGTG CGGTACGGGA TGGCATCCTG TTGGGACGTG CAAAATGGGT 
ATTGATCAAA TGGCGGTTGT CGATCCTCAA CTCAAGGTAC GGGGGATTGA AGGGTTACGA 
GTTGTTGATG CATCGATTAT GCCAACTATG ATCACAGGAA ACACAAATGC ATCGGCAATT 
ATGATTGGAG AAAAGGCTGC CGATTTGATA AAAGTTGGAA CAAAATTGCC TCAATGA

Protein sequence

MTTTYHHSAA FDYIVIGAGS AGCVVANRLT EDPNTKVLLL EAGDPDTKPE LQVPSLWPTT 
LLGSEVDWAY LTEGEPYLNN RKILSSRGKV LGGSSSINGM IYIRGNERDY NSWQALGNIG 
WSYQDVLPYF KKSENQQRGA SLFHGVDGPL SITDPLSPAK VSQRFVEAAI AQGYEQNPDF 
NGVQQEGAGL YQVTVKDGKR QSTAVAFLRP IKDRPNLTIQ TGALVTRLLF EGKRAVGVVY 
VQNGTEYQIR VNSEVILSAG AFDSPKLLML SGIGPAEHLR AVGIPVVFDL PGVGQNLQDH 
PLAVIAYQST QDVPLAPSSN GGEAGLFLHT NNNLDAAPNL QFTIVPILYV DPAYAREGPG 
FTLTFYITRP ESRGSVRLRS SSPFDPPLIR VNYLQKESDM QLMVEGLKIL RQIVYSDAFN 
EFRGEEIAPG SSVHSDKAIE DYIRQTCGTG WHPVGTCKMG IDQMAVVDPQ LKVRGIEGLR 
VVDASIMPTM ITGNTNASAI MIGEKAADLI KVGTKLPQ