Gene Htur_3233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_3233
Symbol
ID	8743853
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	-
Start bp	3332591
End bp	3333631
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	71%
IMG OID	646513816
Product	AIR synthase related protein domain protein
Protein accession	YP_003404770
Protein GI	284166491
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGACC TCGGCAAGAT CGATCGGCAG TTCTTCGACC GCCACGTCGC GCCGAACCTC 
GGCGCGGACC GCGACGACGT CGCCGTCGGC CCCCAGCACG GCGTCGACTT CGGCGTCCTC 
GAGATCGGCG GGCAGGCGCT GGTGACCGCG ACCGACCCCG TCTCGATCAT GCCCCAGTTG 
GGCCTCGAGC GCGCGGCCCG GTTCGCGCTG GACCTCGTGC TCGCGGACGT CGCCGTCAGC 
GGGATCCCGC CGTCGCACCT CTCGATCTGT TTTACCCTCC CCGAGACGAT GACCGACGAC 
GAGTTCGCGA CCGTCTGGAA GACGATCCAC GAGGAGTGCG TCGACCTCGG CGTGGCCGTC 
GTGACGGGCC ACACCGCCCG CTACTCGGAC CCCTCCCACC CGTGGGTCGG CGCCGCGACC 
GCGATGGCCG TCGGCGACCC CGACGAGATC GTCCGACCCG ACGGCGCCCG TCCGGGCGAT 
CGGCTGCTCC TGACGACCGG CCCCGCCGTG GAGTCAGTGG GGCTCTTGAG TACGTTGTTC 
GCCGACCAAC TCGAGGCGGC GCTACCCGGC GACGTGATCG ACGACGCGCA GGACCGACTC 
GAGGAGGTCT ACTGCGTCCG GGACGCCCTC GCAGCGGCCG CCGCGGGGCC GGTGACGGCG 
ATGCACGACG TCACCGAGGG CGGTCTCGCG GGCGCGTTGA ACGAGATGGC CGACGGCGCC 
GGCGCTCGGT TTTCGGTCGA TCGAGACGCC GTTCCGATGC GTCCCGGAGT ACAGGAGGTG 
TGTGACCACC TCGAGATCGA TCCCTGGGCC GCGACCAGCA GCGGCTCGTT GCTGCTCGCG 
GTCGCTCCCG AGGGTGTCGA CGACGTGGTC GCGGCGCTCG AGGACCGGGA CACCGTCGTC 
GCCGAAATCG GCCGGGTGGA GGAACCGAGC GGTACGGACG GAGACGGCGA GGTCGTCGTC 
GACGGCGACC GACTTCCGCA CCCGAGCGTC GACCCCTCGT GGCGGGCGTA CGCCGAACTG 
GCCGATTCAG CGGGCGAATA G

Protein sequence

MSDLGKIDRQ FFDRHVAPNL GADRDDVAVG PQHGVDFGVL EIGGQALVTA TDPVSIMPQL 
GLERAARFAL DLVLADVAVS GIPPSHLSIC FTLPETMTDD EFATVWKTIH EECVDLGVAV 
VTGHTARYSD PSHPWVGAAT AMAVGDPDEI VRPDGARPGD RLLLTTGPAV ESVGLLSTLF 
ADQLEAALPG DVIDDAQDRL EEVYCVRDAL AAAAAGPVTA MHDVTEGGLA GALNEMADGA 
GARFSVDRDA VPMRPGVQEV CDHLEIDPWA ATSSGSLLLA VAPEGVDDVV AALEDRDTVV 
AEIGRVEEPS GTDGDGEVVV DGDRLPHPSV DPSWRAYAEL ADSAGE