Gene Nmar_1644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1644
Symbol
ID	5772978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	1502127
End bp	1503287
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	33%
IMG OID	641317298
Product	hypothetical protein
Protein accession	YP_001582978
Protein GI	161529152
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGTTTTG CTGAAGTTTA TGTTCCATTA CATGAGTACT TGGGATATTT TGATTCAACT 
GGAATTTACA CTGTAGTTGG TAATGTTAAA AATGAAAATG ATTTTGCAAT AATTCCTACA 
ATTACCGTTT CTGTAATTGA AAATTCTGAA ACAATTTCAA AAACTATTCA GCATGTTCCA 
CTTGCTGCTG GAACAGAAAT TCCATTTAAG ATAAAATTTC CTGAAGTACA ATCAAACACT 
CCAGTTCTAG TTAATCCTGA ATTAATTTAT GAACAAACAA TGACTAATCC AGTTCCAATC 
CAAATTCTTT ATGATAAGAC ACTAGTCAAA CATGAAGATG GTCATATATC AGGCAGAATT 
CAAAACACTG GAAATGAAAC AATACACTTT CCAAAAATTT TTGCAGTTGT TCATGGATAT 
GAAAAAGTTC TAGATATTAC TCAAAATATC GAATATATTG AAAAAATTGA ACCTGGAGAA 
ATTCTAGACT TTACAATGTA TCCTGATCCT TCAGTAACTG AGGATATCTT TTACTATAGT 
TGCTTTGCAC CAGTTGATAC TACTGTAATT CCTGTGACTG CAAAGAAGAA TGGTGGTGAT 
TTTGATTTCA GATACGATTC AGGTGCATGG TATTCAGCTG CAAAATTTGA TGAATCTGGA 
ACAACAATGA CAATTAGAGG TTACAATAGT TATCCATTAG AGACATATGC AAACTTTGAA 
TTTGCTCCAA TTTCTGGAAA TGAAAAATTT TCTGTCACAC TAAATGACGA ACCTATAGAA 
TTTATCCAAA GCATTGATGA TATGGGATTC TGGCATGTTG CATTTACTGT TGAGCCTCAA 
TCCCAAGGTG TTTTGAAGAT TTCAGGTTTT GACAAAGGAT TACCTCCTGA ACTTCCTACA 
GTTCCTGTTT GGGTAAAACA AAATGCTGAC TGGTGGGCAA CTCAACAAAT TCCTGATTCA 
GAATTTTTAG AAGGAATTGA CTTTCTTTTT GAAAAACAAA TCCTATCTGT TCCAACGCGT 
GAAGTAGTTT CTGAATCACA ATGGAAGATT CCTCAATGGG TACAAATTCC TGCAGGTTGG 
TGGTATGAAG AAAAAATTAC TGATGAACAA TTCTTAAACA TAATTGAGAA TCTAGTACAA 
CGAGAAATTA TTGTAGTTTG A

Protein sequence

MSFAEVYVPL HEYLGYFDST GIYTVVGNVK NENDFAIIPT ITVSVIENSE TISKTIQHVP 
LAAGTEIPFK IKFPEVQSNT PVLVNPELIY EQTMTNPVPI QILYDKTLVK HEDGHISGRI 
QNTGNETIHF PKIFAVVHGY EKVLDITQNI EYIEKIEPGE ILDFTMYPDP SVTEDIFYYS 
CFAPVDTTVI PVTAKKNGGD FDFRYDSGAW YSAAKFDESG TTMTIRGYNS YPLETYANFE 
FAPISGNEKF SVTLNDEPIE FIQSIDDMGF WHVAFTVEPQ SQGVLKISGF DKGLPPELPT 
VPVWVKQNAD WWATQQIPDS EFLEGIDFLF EKQILSVPTR EVVSESQWKI PQWVQIPAGW 
WYEEKITDEQ FLNIIENLVQ REIIVV