Gene Nmar_0821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0821
Symbol
ID	5773808
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	725326
End bp	726306
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	35%
IMG OID	641316459
Product	biotin synthase
Protein accession	YP_001582155
Protein GI	161528329
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.0695199
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTACTC TAGAGTTCAT CAAAGAGTGT CAAGAAAAAG TATTTTCAGG AAATCACATT 
ACTGCTGAAG ATGCTGAAAA ATTACTAAAC ATTCCAGAGG AGAATCTGAA GGATTTGGCA 
AGATGTGCAA ATGAGATAAC TCGAGATTTT AATGGAGAAA AAGTAGACGT TGAACAACTA 
AACAACATAA AGAAAAATGC ATGTAGTGAA GACTGTACAT TTTGCGGACA GTCTGCATTC 
TTTGATACAG GTATAGAGAC ATACCAACTA CCATCACCTG AAGAAGTAGT GTCAAAGGCT 
CAAAAAGCAA AAGAAGAAGG TGCAGAGTCA TATTGTCTAG TTGCAGCATG GAGAGAACCA 
TCAAGAACAG ATTTTGAAAA AGTTTGCAAA ATTATTACTG AAATTAATGA TAAAGTTGGA 
ATAAGTGTTG AATGTAGTCT AGGATTCCTT ACACAAGAAC AAGCAAAAAA ACTCAAAGAT 
CTCAAAGTAA AAAGATACAA CCATAATTTA GAGACAGCAA AATCAAAATT TCCAGAAATA 
TGTACAACTC ACACATATGA AGACAGACTA GAAACACTAG GAATAGCAAG AGATGCAGGA 
TTGGAGTTAT GTACTGGTGG AATTATCGGA TTAGGTGAAA CAAGAGAACA GAGATTAGAA 
TTAACATTAG AGTTAGCAAG ATTGTACCCT GAAGAAGTAA CAATCAACAT TTTGGTACCA 
GTACCAGGAA CTCCATTGGA ATTACAAACA GATTTGCCAA ATTCTGAAAT TGTCAGAATG 
TTTTCAGTTA TCCGATTTTT ACTTCCAGAG TCAGTCATTA AAATCTCAGG AGGAAGAGAA 
ACCAACCTAG AGGATTCAGG CGAGGAATTA CTTCAAAGTG GAGCAAATGG AATCATTACC 
TCAGGATACC TTACTATGGG GGGCAATGAA GCTCAAAAAG ACCATGCAAT GATTGAAAAG 
ATTGGTCTTA AATCACAATA A

Protein sequence

MSTLEFIKEC QEKVFSGNHI TAEDAEKLLN IPEENLKDLA RCANEITRDF NGEKVDVEQL 
NNIKKNACSE DCTFCGQSAF FDTGIETYQL PSPEEVVSKA QKAKEEGAES YCLVAAWREP 
SRTDFEKVCK IITEINDKVG ISVECSLGFL TQEQAKKLKD LKVKRYNHNL ETAKSKFPEI 
CTTHTYEDRL ETLGIARDAG LELCTGGIIG LGETREQRLE LTLELARLYP EEVTINILVP 
VPGTPLELQT DLPNSEIVRM FSVIRFLLPE SVIKISGGRE TNLEDSGEEL LQSGANGIIT 
SGYLTMGGNE AQKDHAMIEK IGLKSQ