Gene Hlac_3661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3661
Symbol
ID	7402483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012030
Strand	+
Start bp	420305
End bp	422323
Gene Length	2019 bp
Protein Length	672 aa
Translation table	11
GC content	59%
IMG OID	643710192
Product	poly-gamma-glutamate biosynthesis/capsule biosynthesis protein
Protein accession	YP_002567758
Protein GI	222481522
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2843] Putative enzyme of poly-gamma-glutamate biosynthesis (capsule formation)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATCTC TCTCTGGGTG CTCTCAGAGA ATTCAGCGGG TGATTCAGGA CGCTGCCGGC 
GACGAAGCAG CAGTCACCGG TACTGTCACC ACGGGCGGTG ACCCGTTATC GAACGCGTCA 
GTGACCGCTT ATCGAAACGG CAGGGAAATC GCACGAGCCA CAACCGACGA TGATGGAACA 
TACAACGTCT CTCTCGGTGG CTTCCCGGCT TGGGTTCGAT TTGACCACCC GGAGTGCAGC 
TCAGTCACGA GGGCAGTCGC ACCAGGATCG GCAAGAAGTA TCAAACTGAA TTCGGGCGAG 
GAGTCGGTCA GTTTAGCATT TGGCGGGGAC GTGATGTTCG GACGGCGGTA CTACGAGCCG 
AGAGACGACC CACTCCGGTT CTATTACCGG TTACAACCGA CAGACCGTCG GGACTCTCAT 
GACCGATTGC TTGACTCGGT CTCACCACTC TTCGGGGACG CAGATATTGC GTCGATTAAT 
TTGGAGACGC CGCTGACGAC ATCAGAATGG AGGCACCCGT CAAAGGCGTT CGTTTTCACC 
AGCCATCCTG TCGCTGCAGC GGCGATGGCC GACGCTGGAA TCGATTATGC GGCACTTGCG 
AACACGCATG CCTTCGATGC CCTCACGCCA GGGCTTGAAG AGACGATTGA GTCTCTCGAC 
AGGGTCGGAG TCGCCCATTC CGGCGCCGGT TCGGACTCCA CCACCGCCAT TGCTCCAGCC 
ATTCTCGAAC GCGACGGGGT GACTGTCGGA TTCGTTTCGG TAACGACAAC AGCGGGCAGA 
CAATACGAGC GCGATTGGGC GGCCGACGAG ACGACTGGGA CGTATACTGT CAATCGAGAA 
GACGAAACGC TCACTGTTCG GGACAGTGCG GGGGTTGCCG ACGCGACGCC CGAAACGATT 
CGTGCCGGCG TGGAGGCTGC GACCGACCAA GCGGACGTGG TCGTGACACA AATCCATGGC 
GGGGAGGAGT ACCAGCGCAC GCCCACGCGG GAACTCCAGG ATTTGACCGA CACCGCGATC 
GCTGCCGGCT CGGATCTGGT CGTGAACCAC CACCCACACG TGTCAGGGGG ACTTGAGACC 
CGTGACGGCG CGCTCGTCGC GTGGTCGATG GGGAACCTCT TCTTTGACCA GAACCTCTGG 
GCTACTTATC GATCGTTCAT CCTGCAGGTG ACAATCTCTC CCGACGGAAT ACAGTCGGCA 
CGGGCGGAAC CGATCCTCAT TGAGGGTTAC ATCCCACGCG GGGTGACTGG ACCGCTCCGA 
GACCGGCTGA CGTGGGAACT CGCGGGACTC TCGGACAATT CGTTCATGAT TACCGAGGAT 
ACATTGGTAT ACCAGCCTGA CGACGAAAGG CCTACACCCG AACAACTGGC CCTTGACGGT 
GGGGGCCAAC GTAGGGTTCG CGGGTGGGTT ACCGACTCCG ATGACTCGGT TCAACTTGGT 
CGTGAGCGGT TCCTTACCGG GTCGTTCGAT GATCACGATG TTGATAGTGA CGCATACGAA 
GGCACGCTGT GGCGCTACGG CCGTGAATCC CGTAGCAGCG ACCAACCTAT AGGGCGAGAT 
GGGTCCGGAG GTATCGAACT AGTACGCGTT CAAGCAAACG AGAACCGAGC ACTATTCTCG 
CCGTGGAACC GCCTGCCGGT CTCCAACAAG GAATTCACGC TGTCGGGATC ATACCGGACG 
AACGCAGACG GAGAGCTTCG ACTGCTGGTC TCGTGGTACA ACGACACATC TGGAAGTTCG 
TTCCAATCCC AAGAGATGTC ACTCGCGTCG ACGGAGCGTG AATGGACTGA CTTCTCACTT 
GAATTAGAGC GGCCCGATGA GGCCACCCAT ATCGACGTCT TCGTGTTTCT GAGCCCACCG 
GATGGCGTCG ATATCCTGCG TGCGGCGTTC GACACGCTGA GCCTCGTTGA GTGGGAGCCG 
ACCGAGGTTG CCGGCGGCCG GCAGTTCGAT GTCATTCGGG GTTCGTCCGG AGCAACTGTC 
CGTGTGATCC CTGTCGACGG TGAGGTGAGC TGGCAGTGA

Protein sequence

MASLSGCSQR IQRVIQDAAG DEAAVTGTVT TGGDPLSNAS VTAYRNGREI ARATTDDDGT 
YNVSLGGFPA WVRFDHPECS SVTRAVAPGS ARSIKLNSGE ESVSLAFGGD VMFGRRYYEP 
RDDPLRFYYR LQPTDRRDSH DRLLDSVSPL FGDADIASIN LETPLTTSEW RHPSKAFVFT 
SHPVAAAAMA DAGIDYAALA NTHAFDALTP GLEETIESLD RVGVAHSGAG SDSTTAIAPA 
ILERDGVTVG FVSVTTTAGR QYERDWAADE TTGTYTVNRE DETLTVRDSA GVADATPETI 
RAGVEAATDQ ADVVVTQIHG GEEYQRTPTR ELQDLTDTAI AAGSDLVVNH HPHVSGGLET 
RDGALVAWSM GNLFFDQNLW ATYRSFILQV TISPDGIQSA RAEPILIEGY IPRGVTGPLR 
DRLTWELAGL SDNSFMITED TLVYQPDDER PTPEQLALDG GGQRRVRGWV TDSDDSVQLG 
RERFLTGSFD DHDVDSDAYE GTLWRYGRES RSSDQPIGRD GSGGIELVRV QANENRALFS 
PWNRLPVSNK EFTLSGSYRT NADGELRLLV SWYNDTSGSS FQSQEMSLAS TEREWTDFSL 
ELERPDEATH IDVFVFLSPP DGVDILRAAF DTLSLVEWEP TEVAGGRQFD VIRGSSGATV 
RVIPVDGEVS WQ