Gene Nmar_1034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1034
Symbol
ID	5773459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	907775
End bp	909073
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	41%
IMG OID	641316676
Product	elongation factor 1-alpha
Protein accession	YP_001582368
Protein GI	161528542
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG5256] Translation elongation factor EF-1alpha (GTPase)
TIGRFAM ID	[TIGR00483] translation elongation factor EF-1 alpha [TIGR00485] translation elongation factor TU

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGATA AACCACACTT GAACCTGATT GTTACAGGTC ATATTGATAA TGGAAAATCA 
ACAACTATGG GTCATTTCTT GATGGATCTT GGCGTTGTAG ATGAAAGAAC AATTGCATCC 
CATGCATCCG AATCCGAGAA GACCGGAAAA GGTGATACTT TCAAGTATGC TTGGGTAATG 
GATAACATTA AGGATGAAAG AGAGAGAGGT ATTACAATCG ATCTTGCATT CCAAAAATTC 
GAGTCCCCAA AGTACTTCTT TACTTTGATT GACGCTCCTG GTCACAGGGA CTTTATTAAA 
AACATGATTA CTGGTGCTTC TGAAGCCGAC GCAGCAGTCT TAGTACTTTC AGCTAAAGAA 
GGTGAAACCG ATACTGCAAT TGCTGCAGGT GGTCAAGCAA GAGAACACGC ATTCTTGCTT 
AAGACTTTAG GTGTAAACCA ACTAATCGTT GCAATCAACA AAATGGATGA TAGCAACTAT 
TCTGAAGAAG CATTCAAAGT AGCCAAAGAA AAAGGTGAAA AATTAGTAAA ATCTGTAGGT 
TACAAACTAG AAAATGTACC ATTCATTCCA GTTTCTGGAT GGAAAGGTGA CAACTTGGTT 
AAAAAATCCG AAAACATGTC ATGGTACTCT GGTAAAACAC TACTTGAAGC ATTTGATGAC 
TTTACAGTAT CTGAAAAACC AATCGGTAAA CCACTACGTG TTCCAATCCA AGATGTTTAT 
ACCATCACTG GTGTAGGTAC CGTTCCAGTA GGTAGAGTTG AGACCGGAGT TATGAAAGCA 
GGAGACAAAA TCGTCGTAAT GCCTTCAGGT GCTCCTGGTG AAATCAAATC TATTGAAACT 
CACCACACAG AGATGCCATC TGCAGAAGCA GGTGATAACA TTGGTTTCAA CCTTAGAGGT 
GTTGAGAAGA AAGACATCAA GAGAGGAGAT GTTCTCGGAA GTCCTGACAA CCCACCAAAT 
GTTGCAAAAG AATTCAAAGC ACAAATTATT GTAATTCACC ACCCAACAGC AATCGCACCT 
GGTTACACAC CAGTTATGCA CGCACACACT GCACAAGTTG CAGCAACAGT TACTGAGTTC 
TTACAAAAGA TCAACCCAGC ATCTGGTGCA GTTGAGGAAG AAAATCCAAA ATTCCTCAAA 
GTTGGTGACT CTGCAATTGT AAAAATCAGA CCGGTGAGAC CAACATGTAT CGAAACTTTC 
CAAGAATTCC CTGAGATGGG TAGATTCGCC CTTAGAGATA TGGGTGCTAC TATCGCAGCA 
GGAATCGTTA AGGAAATTAC CGAAGAGTAC AAACCATAG

Protein sequence

MADKPHLNLI VTGHIDNGKS TTMGHFLMDL GVVDERTIAS HASESEKTGK GDTFKYAWVM 
DNIKDERERG ITIDLAFQKF ESPKYFFTLI DAPGHRDFIK NMITGASEAD AAVLVLSAKE 
GETDTAIAAG GQAREHAFLL KTLGVNQLIV AINKMDDSNY SEEAFKVAKE KGEKLVKSVG 
YKLENVPFIP VSGWKGDNLV KKSENMSWYS GKTLLEAFDD FTVSEKPIGK PLRVPIQDVY 
TITGVGTVPV GRVETGVMKA GDKIVVMPSG APGEIKSIET HHTEMPSAEA GDNIGFNLRG 
VEKKDIKRGD VLGSPDNPPN VAKEFKAQII VIHHPTAIAP GYTPVMHAHT AQVAATVTEF 
LQKINPASGA VEEENPKFLK VGDSAIVKIR PVRPTCIETF QEFPEMGRFA LRDMGATIAA 
GIVKEITEEY KP