Gene Hlac_0901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0901
Symbol
ID	7401272
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	891568
End bp	892728
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	67%
IMG OID	643707966
Product	cell division protein FtsZ
Protein accession	YP_002565569
Protein GI	222479332
COG category	[D] Cell cycle control, cell division, chromosome partitioning
COG ID	[COG0206] Cell division GTPase
TIGRFAM ID	[TIGR00065] cell division protein FtsZ

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.363847
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTCTA TTGTAGAGGA CGCCATCGAC GAAGCCGAGG AATCCCCGGT AGATGACTCC 
GGGGAGGCCG GCGCCGGCGA GAACGGCGCA ACCGCCGGAG CCCCGCCTCA GACCGGAACG 
ATGACCGACG ACGAGCTGCA GGACGTCCTC CAGGACCTCC AGACGAACAT CACCGTCGTC 
GGCTGCGGAG GCGCCGGCGG CAACACGGTC AACCGGATGA CCGAGGAGGG GATCCACGGG 
GCGAAGCTGG TCGCGGCCAA CACCGACGTT CAGCACCTCG TCAACATCGA AGCCGACACG 
AAGATCCTTA TGGGCCAGCA GAAGACGCAA GGTCGCGGCG CCGGCTCCCT CCCGCAGGTC 
GGTGAGGAGG CCGCCATCGA GTCCCAAGAG GAGATCCAGG ACGCCATCGA CGGCTCCGAC 
ATGGTGTTCG TCACCGCCGG GCTCGGCGGC GGCACGGGGA CCGGGTCCGC CCCGGTCGTC 
GCGAAGGCCG CCCGCGAGTC GGGCGCCCTG ACCATCGCCA TCGTCACGAC CCCCTTCACT 
GCCGAGGGCG AGGTCCGACG AACGAACGCC GAGGCCGGCC TCGAACGGCT CCGCGACGTG 
AGCGACACCG TCATCGTCGT CCCCAACGAT CGCCTGCTCG ACTCGGTCGG GAAGCTCCCC 
GTTCGGCAGG CGTTCAAGGT GTCCGACGAG GTCCTAATGC GCTCGGTGAA AGGTATCACG 
GAGCTCATTA CGATGCCCGG ACTCGTCAAC CTCGACTTCG CCGACGTTCG CACCGTCATG 
GAGAAGGGCG GCGTCGCGAT GATCGGGCTC GGCGAGTCCG ACTCCGACTC GAAGGCGCAG 
GACTCGGTGA AATCGGCGCT CCGCTCGCCC CTGCTCGATG TCGACATCTC CAGCGCGAAC 
TCCGCGCTGG TCAACGTCAC CGGCGGGACC GACATGTCCA TCGAAGAGGC AGAGGGCGTC 
GTCGAGGAGA TCTACGACCG GATCGACCCC GACGCCCGGA TCATCTGGGG AACCTCCGTT 
GACGAGGAGC TGGAAGGCGA GATGCGGACC ATGATCGTGG TGACCGGCGT CGAGTCGCCG 
CAGATCTACG GCCGCAACGG CGAATCGGCC GAGGGAGAAG GAGAAACGCC CGAGATGGAA 
GACATCGACT ACGTGGAGTA G

Protein sequence

MDSIVEDAID EAEESPVDDS GEAGAGENGA TAGAPPQTGT MTDDELQDVL QDLQTNITVV 
GCGGAGGNTV NRMTEEGIHG AKLVAANTDV QHLVNIEADT KILMGQQKTQ GRGAGSLPQV 
GEEAAIESQE EIQDAIDGSD MVFVTAGLGG GTGTGSAPVV AKAARESGAL TIAIVTTPFT 
AEGEVRRTNA EAGLERLRDV SDTVIVVPND RLLDSVGKLP VRQAFKVSDE VLMRSVKGIT 
ELITMPGLVN LDFADVRTVM EKGGVAMIGL GESDSDSKAQ DSVKSALRSP LLDVDISSAN 
SALVNVTGGT DMSIEEAEGV VEEIYDRIDP DARIIWGTSV DEELEGEMRT MIVVTGVESP 
QIYGRNGESA EGEGETPEME DIDYVE