Gene Avin_21660 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_21660
Symbol
ID	7761086
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	2166264
End bp	2167589
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	66%
IMG OID	643805054
Product	monooxygenase, NtaA/SnaA/SoxA family
Protein accession	YP_002799335
Protein GI	226944262
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.714961
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTGGCC CGAGGCAACT CAAACTGGGT GCGATCATTC ACGGTGTCGG CCACGGCTGG 
GGCGATTGGC GCCATCCGGA TGCCGTGGCC GATGCCAGTG TCAATTTCCG TTTCTACCGG 
CAGCAGGCGC AACTGGCCGA GGCGGGCAGG TTCGATTTCC TGTTCATCGC CGACAGCCTG 
CACATCCACG AGAAATCCAG CCCGCACTAC CTCAACCGCT TCGAACCCCT GACCATCCTT 
TCCGCGCTGG CCACCGTGAC CGAGCACATC GGCCTGGTCG GCACCGCCAC GGTCAGCTAC 
ACGGAGCCCT TCAACCTGGC CCGCCAGTTC GCCTCGCTCG ACCATATCAG CGGCGGGCGG 
GCCGGCTGGA ACGTGGTGAC CTCCTGGCTG TCCGGCACGG CCGACAACTT CGGCCGGCCC 
GAACACGCGC CGCACGACCT GCGCTACCGG ATCGCCAGGG AGCACCTCAA CGTGGTCAAG 
GGCCTGTGGG ACTCCTGGGA GGACGATGCC TTCGTCCGCG ACAAGGCGAG CGGCAAATTC 
TTCGATCCCG ACAGGCTGCA TGCGCTCAAC CACCAGGGCG AGTTCTTTTC CGTCAAGGGG 
CCCTTGAACA TCGCCCGTTC GCCCCAGGGA CAACCGGTCA TCTTCCAGGC CGGCAGCTCG 
GAGGAGGGGC GCAACTTCGC GGCGCAGAAC GCCGATGCGA TCTTCGTCAA TCCGGAGTCT 
TTCGACGAAG CGCTCGCCTA TTATCGGGAC ATCAAGACGC GCACGGCCCA ATACGGCCGG 
GACCCGCAGA AGCTGTCGAT CCTGCCGGGC ATCCGGCCGA TCGTCGGACG CGACCCGGCC 
GAGGTCGAGC GGCGTTACCG GCAGGCCGTC GACCTGGTGT CCATCGAGGA TGCCCTCGTC 
GCGCTGGGGC GTCCCTTCAA CGATCACGAT TTCTCGCGAT ATCCCCTCGA CGAGCCCTTC 
CCCGAACTGG GCGATATCGG CAGGGACAGC CAGCAGGGCG AGTCCAACCA CATCAAGCGG 
GTGGCCAGGG AGGAGGGACT CAGCCTGCGC GAGGCCGCCC TGCGCTTTTC CCGGCCGAAC 
CGGGCGTTCG TCGGTACGCC GGAGCAGATC GCCGACACTT TGCAGCACTG GTTCGAGAAG 
GGCGCGGCGG ACGGTTTCAC CATCGGTTCG CTGCTGCCCG ACAGCCTGCA GTCCTTCACC 
GAGCTGGTGG TGCCGGTTCT GCAGGCGCGC GGCCTGTTCC GCCGGGAATA CGCCGGCCAT 
ACCCTGCGCG ACAACCTGGG CCTGGACGTG CCCGTCAACC GCTATAGTGC GAGACGCCTG 
GCGTGA

Protein sequence

MGGPRQLKLG AIIHGVGHGW GDWRHPDAVA DASVNFRFYR QQAQLAEAGR FDFLFIADSL 
HIHEKSSPHY LNRFEPLTIL SALATVTEHI GLVGTATVSY TEPFNLARQF ASLDHISGGR 
AGWNVVTSWL SGTADNFGRP EHAPHDLRYR IAREHLNVVK GLWDSWEDDA FVRDKASGKF 
FDPDRLHALN HQGEFFSVKG PLNIARSPQG QPVIFQAGSS EEGRNFAAQN ADAIFVNPES 
FDEALAYYRD IKTRTAQYGR DPQKLSILPG IRPIVGRDPA EVERRYRQAV DLVSIEDALV 
ALGRPFNDHD FSRYPLDEPF PELGDIGRDS QQGESNHIKR VAREEGLSLR EAALRFSRPN 
RAFVGTPEQI ADTLQHWFEK GAADGFTIGS LLPDSLQSFT ELVVPVLQAR GLFRREYAGH 
TLRDNLGLDV PVNRYSARRL A