Gene Hlac_2248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2248
Symbol
ID	7399958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2236834
End bp	2238111
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	67%
IMG OID	643709322
Product	cysteine desulfurase, SufS subfamily
Protein accession	YP_002566895
Protein GI	222480658
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0748033
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0430442
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAGTTC AGGAACAGTA CCCGTTCGAC GTCGAGGCCG TCCGCGCCGA CTTCCCGATC 
CTCGATCGGC TGGTCGGCGG CGATCCGGAG TCGCCCGGCG AGGGTCCCGG CGACGACACG 
CCGCTCGTCT ATCTCGACAG CGCGGCGACC TCGCAAACGC CGGATCCGGT CGTCGACACG 
ATTGTGGACT ACTACCGCGG CTACAACGCC AACGTCCACC GCGGGATCCA TCAGCTGAGT 
CAGGAGGCCT CCGTCGCCTA CGAGGAGGCC CACGACACCG TCGCGGACTT CATCGGCGCG 
TCGGGCCGCG AGGAGATCGT CTTCACGAAA AACACCACGG AGGCGATGAA CCTCGTCGCA 
TACGCGTGGG GGCTCGAAGA ACTCGGGCCG GGCGACAACG TCGTCCTCTC GCAGATGGAA 
CACCACGCGT CGCTGGTGAC GTGGCAGCAG ATCGGGAAGC GAACCGGCGC CGACGTGCGG 
TTCATCGAGG TGACCGACGA GGGCCGGCTC GACATGGAAC ACGCCGCGGA GCTCATCGAC 
GACGACACGC AGATGGTGTC GGTCGTCCAC GTCTCGAACA CGCTGGGCAC GATCAATCCG 
ATCTCGGAGC TGGCCGACCT CGCGCACGAC CACGACGCGT ACGTCTTCGC CGACGGCGCG 
CAGTCGGTGC CGACTCGGCC GGTCGACGTC GACGACCTCG GCGTGGACTT CCTCGCCTTT 
TCCGGGCACA AGATGTGCGG CCCGACCGGT ATCGGGGCGC TGTACGGCCG CGAGGAGATC 
CTCGACGAGG TGCAGCCGTA CCTCTACGGC GGTGACATGA TCCGACGCGT CTCCTTTACG 
GACTCCACGT GGGAAGACCT CCCGTGGAAG TTCGAGGCCG GCACGCCTTC GATCGCGCAG 
GGGATCGCCT TCGCGGCCGC GATCGAGTAT CTGGAAGAGA TCGGCATGCA GAACGTGCAG 
GCCCACGAGG ATCTGCTGGC GGAGTACGCG TACGACGAGC TGACTGACCT CGGCGGCGTG 
GAGATCTACG GGCCGCCGGG CAACGACCGC GGCGGTCTCG TCGCGTTCAA CGTCGAGGGC 
GTCCACGCCC ACGATCTGTC CAGCATCCTC AACGACTACG GCGTCGCGAT CCGTGCCGGC 
GACCACTGCA CCCAGCCACT CCACGACGAG CTTGGCGTCG CCGCCTCCGC GCGCGCCTCC 
TTCTACCTCT ACAACACCGT CGAGGAGATC GACGCCTTGG TCGAGGCTGT CGGTGAGGCG 
CGCGACCTGT TCGCGTAG

Protein sequence

MGVQEQYPFD VEAVRADFPI LDRLVGGDPE SPGEGPGDDT PLVYLDSAAT SQTPDPVVDT 
IVDYYRGYNA NVHRGIHQLS QEASVAYEEA HDTVADFIGA SGREEIVFTK NTTEAMNLVA 
YAWGLEELGP GDNVVLSQME HHASLVTWQQ IGKRTGADVR FIEVTDEGRL DMEHAAELID 
DDTQMVSVVH VSNTLGTINP ISELADLAHD HDAYVFADGA QSVPTRPVDV DDLGVDFLAF 
SGHKMCGPTG IGALYGREEI LDEVQPYLYG GDMIRRVSFT DSTWEDLPWK FEAGTPSIAQ 
GIAFAAAIEY LEEIGMQNVQ AHEDLLAEYA YDELTDLGGV EIYGPPGNDR GGLVAFNVEG 
VHAHDLSSIL NDYGVAIRAG DHCTQPLHDE LGVAASARAS FYLYNTVEEI DALVEAVGEA 
RDLFA