Gene Hlac_1021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1021
Symbol
ID	7401916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1013044
End bp	1014120
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	70%
IMG OID	643708087
Product	FAD-dependent pyridine nucleotide-disulphide oxidoreductase
Protein accession	YP_002565688
Protein GI	222479451
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0492] Thioredoxin reductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.664925
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCGT CCGACGACGA GTACGATATC GCGGTGGTCG GCGGCGGGCC GGCCGGCCTG 
ACGACTGCCC TATACGGGGC GCGACTGGGC CACGAAACGG TGCTGATCGA CCGCGGCGGC 
GGCCGCGCGG CGATGATGGC CGACACGCAC AACGTGATCG GCGTCACCGA GGAGACCTCC 
GGCAACGAGT TCCTCGCGAC CGGCCGCGAG CAGGTGCAGT CGTACGGCGG CACGTTCGAG 
CGCGGCTTCG TCACCGACGT CGACCGCACC GACGACGACC GATTCCGGCT CTCGACGACC 
GGCGCCGAGA TTCTCTCCGA TCGCGTCGTG CTCGCCACCG GCTTCTCCGA CAAGCGGCCG 
GATCCGCCGC TCCCGCGGAC GGGCAAGGGG CTCCACTACT GTCTCCACTG TGATGCGTAC 
ATGTTCGTCG ACGAGCCGGT GTACGTGATG GGCCACGGCG AGGCGGCCGC CCACGTCGCG 
ATGATCATGC TGAACGTGAC CGACGACGTG GATATCCTGA CCCGGGGCGC GGAGCCGACG 
TGGAGCGACG AGACCGCCGC ACAGCTCGAC GCACACCCGG TCGAGGTCGT CAGCGAGGAC 
GTGACGGGCG TGGAGAACGA CCCCGACTCC GGCTGGCTGG AGGCGCTGGA GTTCGAAGAC 
GGCACCCGCC GCGAGTACCG CGGCGGCTTC GCGATGTACG GCTCCGACTA CAACACCGCG 
CTCGCCGAGG GGCTCGGCTG CGATCTGACC GAGGGCGGCG AGATCGACGT CGACGACCAC 
GGCCGTACCA GCGAGAACGG CGTGTTCGCG GTCGGCGACA TCACCCCCGG CCACAACCAG 
GTACCCGTCG CCATGGGGCA GGGCGCGAAA GCCGGCCTCG CGATCCACAA GGATATCCGC 
GAGTTCCCGC GCTCGCAGGA GACGATCGAG GCGGACGGCC CCGTCGACGC CGACGAGGTG 
CCCGCCATCT CGCCAGCGCT CATGGCGACC GCGGTCGCCC ACGAGGGCCA CGCGGGTGGA 
GCGCGGGTGA AAGGCGTCGA GGCCAAAGAG GAGACGCCCG CGGCTGACGA CGACTGA

Protein sequence

MSSSDDEYDI AVVGGGPAGL TTALYGARLG HETVLIDRGG GRAAMMADTH NVIGVTEETS 
GNEFLATGRE QVQSYGGTFE RGFVTDVDRT DDDRFRLSTT GAEILSDRVV LATGFSDKRP 
DPPLPRTGKG LHYCLHCDAY MFVDEPVYVM GHGEAAAHVA MIMLNVTDDV DILTRGAEPT 
WSDETAAQLD AHPVEVVSED VTGVENDPDS GWLEALEFED GTRREYRGGF AMYGSDYNTA 
LAEGLGCDLT EGGEIDVDDH GRTSENGVFA VGDITPGHNQ VPVAMGQGAK AGLAIHKDIR 
EFPRSQETIE ADGPVDADEV PAISPALMAT AVAHEGHAGG ARVKGVEAKE ETPAADDD