Gene Hlac_0221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0221
Symbol
ID	7402150
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	238970
End bp	240190
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	71%
IMG OID	643707284
Product	acyl-CoA dehydrogenase domain protein
Protein accession	YP_002564896
Protein GI	222478659
COG category	[I] Lipid transport and metabolism
COG ID	[COG1960] Acyl-CoA dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.338225
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0253718
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGTACG ACGATATCGG TCGCGGGCCG GAGATCGCCG AGGCCGTCAG GGAGTTCGTC 
GACGAGACGG TGCTTCCGGT CGAGCGGGAG TGGCTCGGCC GAGGACCGAT CCCGCCGGCG 
GACATAGAGG CGCTGCGCGA CGCCGCGCGC GACGAGGGGA TCTACGCCCC GCAGGTCGCC 
GAGGAGTACG GCGGGCTCGG ACTCGGGTTC CGCGAGATGC TGCCGGTGTT CGAAGAGGCG 
GGCCGGAGCC TGCTCGGGCC GACGGCGCTC CGGTGTGCGG CGCCCGACGA GGGGAACATG 
CACACCCTCG AGATCGCGGC CACCGACGCA CAGAAGGAGC GCTGGCTCCG CCCGTTGGCG 
GCCGCGGAGA TCGACTCGGG GTTCGCGATG ACCGAGCCGA TGCAGGGCGG GGGGTCGGAC 
CCGAAAATGC TGGCGACGAC CGCCGAGAAA GACGGCGACG AGTGGGTCAT CGACGGCCAC 
AAGTGGTGGA CGACCGGCGG CGTCGAGGCG AACCTCCTCC TCGTGTTCGC CCGCACCGAT 
CAGGAGGCGC ATCCGTACGC CGGTTGTTCG GTTATCCTCG TGCCCGCCGA CGCCGACGGC 
GTCGAGGTCG TTCGGAACAT CCCGCACCTC GGCGAGGGGC TGGTCGGGAC GACGCACGCC 
GAGATCCGGT TCGACGACGT GCGCGTGCCG GTCGAGAACA CGCTCGGCGA GGAGAACGAG 
GGGTTCACCC TCGTCCAACA GCGGCTGGGT CCGGCCCGGC TCACCCACTG CATGCGGTAC 
GCCGGGATGG CCGATCGCGC GCTCGACATC GCGACCGCCT ACCTCTCCGA GCGGGAGGGG 
TTCGGCGAAC CGCTCTCGGA GAAGCAGGGG CCGCGGTTCC GGATCGCCGA CCGCCGCACC 
GAGCTCCACG CCGCGCGCAC GATGGTCCGG CACGCCGCCG GGCGGATCGC CGACGGTCAC 
GAGGCGCGCA TCGAGGTCGC GATGGCAAAG ACGTTCGCGG CGAACGTGAC GCAGGAGGCG 
ATCGACGACG CGCTCCAGTT CTGCGGCGGC AACGGGATCG CGTACGACCT GCCGATCGCG 
CGCTTCCACG AGAACGTCCG GCAGTTCCGC CTCGTCGACG GCGCCGACGA GGTCCACCGC 
CGGTCGATCG CGCGGGACGC CTTCGAGGAC CCGCCGGCCG AGGAGCTTGA GACCGTCACG 
CGGTTCGGCG AGTTCGACTA A

Protein sequence

MEYDDIGRGP EIAEAVREFV DETVLPVERE WLGRGPIPPA DIEALRDAAR DEGIYAPQVA 
EEYGGLGLGF REMLPVFEEA GRSLLGPTAL RCAAPDEGNM HTLEIAATDA QKERWLRPLA 
AAEIDSGFAM TEPMQGGGSD PKMLATTAEK DGDEWVIDGH KWWTTGGVEA NLLLVFARTD 
QEAHPYAGCS VILVPADADG VEVVRNIPHL GEGLVGTTHA EIRFDDVRVP VENTLGEENE 
GFTLVQQRLG PARLTHCMRY AGMADRALDI ATAYLSEREG FGEPLSEKQG PRFRIADRRT 
ELHAARTMVR HAAGRIADGH EARIEVAMAK TFAANVTQEA IDDALQFCGG NGIAYDLPIA 
RFHENVRQFR LVDGADEVHR RSIARDAFED PPAEELETVT RFGEFD