Gene Nmar_1638 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1638
Symbol
ID	5774751
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	1494591
End bp	1496462
Gene Length	1872 bp
Protein Length	623 aa
Translation table	11
GC content	35%
IMG OID	641317292
Product	hypothetical protein
Protein accession	YP_001582972
Protein GI	161529146
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTACATT TATCGAATGA ACCATTCCCA TTATATTCAA AACAATGTTT TAGATTTCAT 
ATGGCAAAAA GTATGGGAAC AATTGCAATT TTCGCATTTA TGGTAATTTT AACATCTACA 
ATTACAATAT CCCCAGTCTT AGCTGATACT GGTTTTACAA ATGTACAAAA ATCAGCAGGA 
ATTATAATGA AATTCTGTGC AAATGAAACT TTCAAACTAC AAGATTGTAA TGAAAGATAT 
GAAGGAATTG GCTGGACTGA TAGAGTAAAC GTCTTGATTT ATGCTCCAGG ATGGAACGAG 
GATGATGATA AAATTGAACA AATTGGTACC ACATCAAATC CAATTGATGT CTACACTGAT 
GCCAACCGTG TAAATGGCGT TGAGTTTACA GAAACTGGCC CTGATACTGG CATATTCATG 
GGAGTTGTAA AATTGACAGG TGCAATGCGT TATACTGTTC ATGATACATT TCTTACTACT 
GTTAAAACAC CTGGAATGAC TATGGATCCA GATGGAATGA ATATTTCAGC ACATGATAGG 
GCTGTAATGA TTGCAACATC TACACAAGAT GGTAGATTAA CAGTTGACTG GGAATATAAT 
GAAGATCAAC ATGTTTACAA AACTGCATAT TATACTTGGC AAATGGGACA AGCTGAATTC 
CACAAAGATA CCTATGATGT AAATGAAAAA GTCACATTTT TCATACGTGA TACCGACTTG 
TGGAAGCACC ACCGAGAATT TTTCACAAAT TATGTTAAAG TATATTCAGA TTCAGATAAA 
GCAGGAATAT TTGTTGGTGT TCAATTTGTA AAAGATATGG ATCATGCAAA AATTCAGAAT 
GCAGTATATG ATCGTCACTT GAGTGAACCA GCTGCAAGCT CATTAACAAA ATACACTCCT 
GATGGAGAAT GGAAAACATA TCTCTGGACT GAACCAGGTG GTGTAATTGG TGTTGATCAA 
GATTATGACT TTAACTTAAT GGTTCATGAT GGCTTAACTG ACATCCACGA GATGGGATTG 
TCTTATGATA TGGATATCTA TCTTAACGGT GAATTAATTG AATCAAGAAA TGATCAATAT 
TGGGTAGACG GACAAGGTGT AGAACCAATT CGCTTTGATG AGAGAGGCTC TGCTAAAATT 
GTAGTTTCTA ACATCTTTGA TCAACCTGGT CAAGAAGTAA ATTTCTCATT CCAAGTTGCA 
CCTGAAGCAA TTTTAGAAGA AGTTGTACCT AGACATGGTT CCTTTGAAGT TGGAAGTACT 
CCTAATTACT TTGTAGGATA TGAACATCCT CACTATATCA ATTATCTTCC AGGCGAGTTC 
TTTATGACCA CTGGAGATTC TTCTCAAGAG CAAAATAGAT TGAGAGTTAC AAATGGTGAT 
ACAATTTACA TTGAATATGA AGACATTACA TTACCACGAC CATACACTAC TGCTGATAGT 
ATGGAAATAG TTGCAAGAGC ATTAGTTCTT GATACTGGCG TTCATATGGT TTCAGATGAT 
TCAGAGATAT TTGTTGAAAC ACCTAGACCT ACAGTAACTC CGGTTTCAAG TGACATTGAT 
ATGTCAAAAC CTACAATAAC TTCTGTTTCA ACTGACATTG CAATTCCGGA TTGGGTAAAG 
AAGAATGCAA TGTGGTGGTC TGATGGACAA ATCAATGATC CAGACTTTGC AAAAGGTATT 
GAGTATCTAG TTCAAGAAAA TATCATTAGT GTATCTGCTG CAGAAGAAAT TGTTGATGAA 
GATGTAAACA TAACATCAAT TCCAATGTGG GTAAGAAATA ATGCAGGTTG GTGGTCTGAA 
GGTCATCTTA CTGATGTAGA ATTTGCAAAT GGAATCAAAT TCTTGATGGC ATCTGGATTA 
ATCAAAGTCT GA

Protein sequence

MVHLSNEPFP LYSKQCFRFH MAKSMGTIAI FAFMVILTST ITISPVLADT GFTNVQKSAG 
IIMKFCANET FKLQDCNERY EGIGWTDRVN VLIYAPGWNE DDDKIEQIGT TSNPIDVYTD 
ANRVNGVEFT ETGPDTGIFM GVVKLTGAMR YTVHDTFLTT VKTPGMTMDP DGMNISAHDR 
AVMIATSTQD GRLTVDWEYN EDQHVYKTAY YTWQMGQAEF HKDTYDVNEK VTFFIRDTDL 
WKHHREFFTN YVKVYSDSDK AGIFVGVQFV KDMDHAKIQN AVYDRHLSEP AASSLTKYTP 
DGEWKTYLWT EPGGVIGVDQ DYDFNLMVHD GLTDIHEMGL SYDMDIYLNG ELIESRNDQY 
WVDGQGVEPI RFDERGSAKI VVSNIFDQPG QEVNFSFQVA PEAILEEVVP RHGSFEVGST 
PNYFVGYEHP HYINYLPGEF FMTTGDSSQE QNRLRVTNGD TIYIEYEDIT LPRPYTTADS 
MEIVARALVL DTGVHMVSDD SEIFVETPRP TVTPVSSDID MSKPTITSVS TDIAIPDWVK 
KNAMWWSDGQ INDPDFAKGI EYLVQENIIS VSAAEEIVDE DVNITSIPMW VRNNAGWWSE 
GHLTDVEFAN GIKFLMASGL IKV