Gene Nmul_A1705 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1705
Symbol
ID	3784804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1945346
End bp	1946446
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	55%
IMG OID	637811792
Product	FAD dependent oxidoreductase
Protein accession	YP_412395
Protein GI	82702829
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTCCCG ACGGAGAGAT ATCGGATGTT GTTGTCATAG GCGGCGGACC GGCGGGCGCC 
ATCTGCGCGC TTGCGCTCGC ACGTGCGGGT GTCGATGTAA AGCTCATGTA CTGGGGAGGT 
TACGCTCCCG GCGGCATCGA ACTCGTATCG GGTCGAGGGC GACATTTTAT CGAGCAGTAC 
TGTCCCGATT TTTTTTCAGA AGTAGTGCAT GGAATAGAGA TTCATGAAAC CGCCTCGCTG 
TGGGATACGG CCGAGCCGGT AATATTCAAT GCAATGTTTA ATCCATGGGG CGCTGGCGTA 
GCGATTGAGC GTTCGCTTCT GGATGGGGCT TTGCGAAATC TTGCTTCCGG CGCGGGCGGC 
ACTATAATTC CCGACGCCAA GGTAGTGGAC GTAGAGCGCC AGCATGACAG GTGGCGGCTG 
ATCGCGCGTT CTTCCGAGGA CGCATCTTCC AATGAAACCA CTTCCCGGGC AGGCGAATTC 
GCTATTTATG CGCGTTTTAT AGTGCTTGCG ACAGGACGCG TGCCGCTGCC GTTTTTCGAC 
CATGCACCCG TTGCAGAGTC CTCGCAAATT GCCCTGATGA CTTCCCTCCA GGCTCGGATA 
GCCCCTCGCC ACACTCTCTA TGTCGAAGGT ACCCGAAACG GGTGGTGGTA CGCTTTGCCT 
GCCGAAAAAG GTTATTTCGC CAGTTTTTGT ATCGGGCGGA ATGAACTCAA GCAGCGGCAG 
TCGCGCTTGA AGGATTTTTT CTTTCAGGAA TTGCAGTGTA CCCGCCTTCT CGCGCCATTG 
TCGGCGGGAG CTTTCGATCA GCGGCCAATA GCCGGACGAA TGGCTGGCGC GACGATGTTC 
CCAGCAATGG GCGGAGACGC CTGGATTGCA GTCGGAGATG CAACGGCAGC GCCGGATCCT 
CTCAGTGGAA CGGGGATCGA GTGGGCAATC GAATCCGCGC AACTCGGCGC AGACATGTTA 
CTGGAAGCAT TGCATGGATC TAAAGGCAAT GTTCTTTTCG ATCTTCCGCG TTATGAAAAT 
ACGATACGCC GACGCATCGC CGCTCAGGAA AAGACAGCCG CTTACCATTA CCACAGGTTA 
AAAGAGATAA GGGAAACATA G

Protein sequence

MFPDGEISDV VVIGGGPAGA ICALALARAG VDVKLMYWGG YAPGGIELVS GRGRHFIEQY 
CPDFFSEVVH GIEIHETASL WDTAEPVIFN AMFNPWGAGV AIERSLLDGA LRNLASGAGG 
TIIPDAKVVD VERQHDRWRL IARSSEDASS NETTSRAGEF AIYARFIVLA TGRVPLPFFD 
HAPVAESSQI ALMTSLQARI APRHTLYVEG TRNGWWYALP AEKGYFASFC IGRNELKQRQ 
SRLKDFFFQE LQCTRLLAPL SAGAFDQRPI AGRMAGATMF PAMGGDAWIA VGDATAAPDP 
LSGTGIEWAI ESAQLGADML LEALHGSKGN VLFDLPRYEN TIRRRIAAQE KTAAYHYHRL 
KEIRET