Gene Hlac_1059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1059
Symbol
ID	7400131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1055890
End bp	1057062
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	69%
IMG OID	643708127
Product	poly-gamma-glutamate synthesis protein (capsule biosynthesis protein)
Protein accession	YP_002565726
Protein GI	222479489
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2843] Putative enzyme of poly-gamma-glutamate biosynthesis (capsule formation)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAACAC GCCGGACTCT GCTGGCATCG GGCGTCGCCG GACTCGTGGG ACTCGCCGGG 
TGCGCCGCTA CGCCGCCGAC TGCGGACGAC GAACGTCGCA GAGCGACCGG CAACGCCTCC 
GCCACGGGCG ACGACGACGC TGACGCGAGC GACGAGGACA CCACCGAAGG CGACGTGACC 
CGGATCGGGT TCGTCGGCGA CCTGATGCTC GGCCGGAGCG TCAACGAGCG GTGGGTCGAC 
GACGACAATC CTGAAAACGT CTGGGGATCG ACGCTCTCGC GGCTTCAGGA ACTCGACGGA 
CTGGTCGGGA ACTTGGAGTG TTGCGTCTCC GATCGCGGGA CGCGCTGGCC GAACAAGGGG 
TACTACTTCC GAGCGGCTCC CGCCTTCGCG GTGCCGGCCC TCGAAGCCGC AGGTGCCTCG 
TTCGTCTCGC TCGCGAACAA TCACGTTCTC GACTACCGCG AGCCCGCGCT GCGCGACACC 
GCCTCGCACC TGACCGACGC GGGAATCGCA CACGCCGGCG CCGGCACTAA CCGGGAGTCG 
GCGCTCGAAC CCGCGGTGTT CGAGGCGGAC GACCTGACCG TCGCGGCGTT CGGCCTCACC 
GACCAGTCCG AGGAGTTCGC GGCGGGAGCG TCGGAGCCGG GAACCGCCTT CGCGACGCTC 
GATCCCGCCG TGTCCCCGAC GCGCTCGCTC GTCGAGGAGA TTCTCGACCG CGCGGAGACA 
CACGACCCCG ATCTCGTCGT CGCCTCGCTC CACTGGGGAC CGAACTGGGA GACCGAACCC 
CGAGCGGTCC ACGAGCGGTT CGGCCGGTGG CTCGTCGATC AGGGTGTCGA CGTGGTCCAC 
GGCCACAGCG CGCACGTCCT CCAAGGGGTC GAGGTGTACC GAGGGCGCCC GATCATCTAC 
GACGCGGGAG ACTTCGTCGA CGACTACGTC GACTACATCG ATCGGGAGGG CGTCCACAAC 
AAGCGGAGCG CCCTCTTCGA GCTGGTCGTG CGCGACGGCG ACCTCGACGA GCTGGTCGTC 
GAGCCGACCG CGATCGTCGA CGAGGCGGCG ACGCTGGCGG ACGACAATAT CGCCGAGTGG 
GTGCGCGACA CCCTCGTAGA GCGGTCTGAG GCGTTCGGGA CCGAGGTCGA GCGGAGGGAC 
GCCCGGTTGG CGTTCCCGCT GGGCGAGGAC TGA

Protein sequence

MRTRRTLLAS GVAGLVGLAG CAATPPTADD ERRRATGNAS ATGDDDADAS DEDTTEGDVT 
RIGFVGDLML GRSVNERWVD DDNPENVWGS TLSRLQELDG LVGNLECCVS DRGTRWPNKG 
YYFRAAPAFA VPALEAAGAS FVSLANNHVL DYREPALRDT ASHLTDAGIA HAGAGTNRES 
ALEPAVFEAD DLTVAAFGLT DQSEEFAAGA SEPGTAFATL DPAVSPTRSL VEEILDRAET 
HDPDLVVASL HWGPNWETEP RAVHERFGRW LVDQGVDVVH GHSAHVLQGV EVYRGRPIIY 
DAGDFVDDYV DYIDREGVHN KRSALFELVV RDGDLDELVV EPTAIVDEAA TLADDNIAEW 
VRDTLVERSE AFGTEVERRD ARLAFPLGED