Gene Pars_2275 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2275
Symbol
ID	5056203
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	2036576
End bp	2037547
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	61%
IMG OID	640469827
Product	respiratory-chain NADH dehydrogenase, subunit 1
Protein accession	YP_001154471
Protein GI	145592469
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0754968
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.291328
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCTCC TCTCGCCCGA GCTGTTGGCC GCCGTGGTCT TCCCAGGGGT GCTGGCCATG 
CTCGGCTTTT TGGTTGTGGC TATATGGGCT GAGAGGAAGC TTGTGGCGAG GATTCAGTGG 
CGCTATGGCC CCCTCTACGT CTCAAAGCCC ATTGGCGGTT TCCTCCAGCC GATTGCCGAC 
TTGGTGAAGC TGGTGTTCTC CGAGCTGGTG TTGCCGAGGC ACACTAACCG TTTCCTCTTC 
GCCGCGACTC CGGTAATACT GTTTATCGCC GAGGCTCTGC CCGCGGCGTT TATAGCCGCG 
GCGCCGGGCC TCGTGATTCT TTACAACCCA TACGGCGTGG TGATCGCCGC CGTCGTTATG 
CTCCTCGTTG CTGTGTTTCT GGTGGCCATG GCCTGGACGG AGGCGGATAG GTGGACCTAC 
ATCGGCGCGG TGAGGGAGAT ATTATTGACC GCCGCCTACG AGGTGCCCCT CCTCTTGTCC 
ATTCTTGCCA TGGTTGTGCT TTACGGCACC GCCGACCCCT TCGGCGTTGT GGAGAAGCAG 
TGGGTATGGG GGGTACTGCT CAACCCCCTG GCCTTTGTGG CGTTTTACAT CTCCCTCATG 
ATGTCCACCA CGAGGTTTCC TTTCGAAATA CCAGAGGCCG AGCCTGAGGT GGTGCTGGGG 
CCCTACACGG AATACGGCTC CACCCTCTTC ATCTTGTCCT TCGGCGGTAC GTATGTCAAG 
ATGTACGCGG CCTCGCTCCT GGGCGTTGCG TTGTTTCTCG GCGGCTGGCT CCCCGCGGGC 
GACACCGTGT CAGGGGCCGC CGTCACCGCC GCCAAGCTCG CGCTGTTTGT TCTGCCCCTC 
CTCCTGGTGA GGGCGATTTA CCCCAGGTAC CGCATCGACC AGGCGCTGAG GCTGGGCTGG 
ACTAAGCTAC TGGCTCTATC CGTTGCGGCA GTGGCCTGGT CTCTGGCGGC GAGGCTATGG 
TTGGGTTTCT AG

Protein sequence

MILLSPELLA AVVFPGVLAM LGFLVVAIWA ERKLVARIQW RYGPLYVSKP IGGFLQPIAD 
LVKLVFSELV LPRHTNRFLF AATPVILFIA EALPAAFIAA APGLVILYNP YGVVIAAVVM 
LLVAVFLVAM AWTEADRWTY IGAVREILLT AAYEVPLLLS ILAMVVLYGT ADPFGVVEKQ 
WVWGVLLNPL AFVAFYISLM MSTTRFPFEI PEAEPEVVLG PYTEYGSTLF ILSFGGTYVK 
MYAASLLGVA LFLGGWLPAG DTVSGAAVTA AKLALFVLPL LLVRAIYPRY RIDQALRLGW 
TKLLALSVAA VAWSLAARLW LGF