Gene Nmar_1144 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1144
Symbol
ID	5774510
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	1046995
End bp	1047993
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	38%
IMG OID	641316787
Product	cytochrome c biogenesis protein transmembrane region
Protein accession	YP_001582478
Protein GI	161528652
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0785] Cytochrome c biogenesis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.0421385
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAACGG TGGTAATTGC AAAAAAATCA ATGGTAATAA TTTCATTTGC ATTATTTTCA 
TTAATCTTTC TTGGAATAAT TTTTTCGCTT GGAACAAATT TTACAATAGA AGGTAAAGAA 
CACACAACAT ACCTCTCATG GATAGTAATT GCATATGTTG CAGGATTGTC CATGATTGTT 
CTTCCATGTA CACTGCCACT GGTATTCATC ATAGTTCCAC TAAGTATGGG ACAAGGGTAC 
AAGAAAGGAT TAGCCATGGC ATTACTTTTT GGTCTAGGAC TAGTCATTAC AATTGCATCT 
TATGGAATTG CAATTGCAGG AATTGGGCAA AGTGCATCAC TAGACCAAGC ATCAACTATC 
ATGTTCTTAA TTGCAGGAAT TGCGGCATTT GTCTTTGGAT TATCACAACT AAAAATTATT 
TCATTAAAGC TACCATCGTA TTCAGGAACT CCAAAGTTTA TCCAGAACAG AGGAGAATAT 
ACAAAATCAT TTTTCATGGG ATTACTATTA GGAAATGCAG GAGTTGGATG CCCCAATCCG 
TTGTTTTACT GGCTACTAAT CTACATTGCA GGAACAGGCA GTATCGAAGT CGGAGCTTCA 
TTAGGAGTAG TTCACGGAGT TGGAAGGGCA ATTCCCCTAA TTTTGATGTC AGTTCTTGCA 
GTAATTGGAA TCAATGCAAC AAAGAGTTTG ACTCTAAAAC GAGAATCAAT TGAGCGAGCA 
TCAGGATGGA TGCTAATAGT GATTGGGGCA TTTTTGATAA TCAACGGACT GCCAGAGGGA 
CACGAATGGT ACGAAGAACT ATTCATCCAT CAAGGATGGA ATCAACTCGT TGAGATGACA 
GGAATACCAG CAGAATTTGA GATGGACGAA CATACACATG ACCACGGACA TGTAGAAGGA 
AGAGATTTCA AAGTATTTTA CACAGCTTTG TTAGCGGTAT TGGTATTGAG TCCGTTGTTC 
ATACGTTCAG TTAGAAAAAT CAGGGAGGTG AATGCATGA

Protein sequence

MSTVVIAKKS MVIISFALFS LIFLGIIFSL GTNFTIEGKE HTTYLSWIVI AYVAGLSMIV 
LPCTLPLVFI IVPLSMGQGY KKGLAMALLF GLGLVITIAS YGIAIAGIGQ SASLDQASTI 
MFLIAGIAAF VFGLSQLKII SLKLPSYSGT PKFIQNRGEY TKSFFMGLLL GNAGVGCPNP 
LFYWLLIYIA GTGSIEVGAS LGVVHGVGRA IPLILMSVLA VIGINATKSL TLKRESIERA 
SGWMLIVIGA FLIINGLPEG HEWYEELFIH QGWNQLVEMT GIPAEFEMDE HTHDHGHVEG 
RDFKVFYTAL LAVLVLSPLF IRSVRKIREV NA