Gene Hlac_2199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2199
Symbol
ID	7401134
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	2182526
End bp	2183866
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	68%
IMG OID	643709271
Product	aminotransferase class-III
Protein accession	YP_002566846
Protein GI	222480609
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0160] 4-aminobutyrate aminotransferase and related aminotransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCGCG ATACCGCCGC GCCCGACGTG ACTGACCTCC CGGGCGACCG CGCACGAGAG 
TGGGTGGAGT ACCACCACGA GTCGGCCGCG CCGAGCACGT ACGTCTACGA GTTCGTCTGG 
GACCGCACCG CGCCCGCCGA AGGACCGTTC TGCACCGACG TCGACGGCAA CGTCCTCATG 
GACTTCACGA GCCACGTCGC CGCCGCGCCG CTGGGGTACA ACAACCCGAA GATTATGGAG 
CCGCTCGCGG AGTTCGACCT CGTCGACCCG CTGAAGATCG CGGGCCAGGA CTTCTACGTC 
GCCGGCGGCG AGTCGCCCGG CGACGGGCTT CCGGGTTCGT CCGGGTTGAT GGAACGGCTC 
ACTGAGATCA CCGCCCACTA CGACATGGAC ACCGTCTTCC TCTCGAACTC GGGGGCAGAG 
GCGGTCGAGA ACGCGATCAA GATCGCGTAC GACGACTCCG GCGGCGCCAA ACACGCGATC 
ACGTTCGACG GCGCGTTCCA CGGGCGGACG CTCGGCGCGC TCTCGCTCAA CCGCTCGAAA 
TCCGTGTATC GCCGCGATTT CCCGGAGATC AGCGGGATTC ACGACGCACC CTTCTGCGAC 
GACCGGAACT GCACCGCCGA GACCTGCTCG TGCGGCTTCT TCGTCGACGG CGCGTCGCAA 
CTCCGACGCA AGCTCGACCC CGAGCGCGGT CACATCGACC CCGACGACGT AGCGTACCTC 
ATCTTAGAGC CGATCCAAGG GGAAGGGGGA TACCGGTTCC CCTCCGACGC GTTCACCGAC 
GAGATCGCCG CCTTGGTCGA CGAACACGAC ATCACGCTGA TCGCCGACGA GATCCAGTCG 
GGCGTCGGTC GCACCGGCGA GATGTGGGGC TCGGACCACT ACGCGCTCGA ACCCGACGTG 
ATCACCAGCG CGAAGGGACT CCGTGTCGGC GCCACGATCT CCCGCTCGGA CGTGTTTCCC 
GAGGAAAAGA GCCGGCTCTC CTCGACGTGG GGGGCGGGCG ACATCATCGC TTCCGCGCAG 
GGCGCGCTCA CGCTCGACGC GATCCGTGAG CACGACCTGA TGGACAACGC CACGGTTCGA 
GGGCGACAGT TCAAAGAGAC GATGCGCGAC GCCGACCTCC CGGGCGTCGA CGACGTGCGC 
GGGAAGGGGC TGCTGCTCGC GGTCGAGTTC GACTCGAAGG AGCGCCGCGA CGCGGTCCAG 
AAAGGCGCGT TCTCCCGGGG CCTGCTCACG CTGGCGTGCG GCCACGACGT ACTCCGCGTC 
CTCCCGCCGC TCGACGTCAC CGAACGCGAG ATCGAGCTCG GCTGCGACCT CCTCACGAGC 
GCGATCGCCG ACGCGGCGTA G

Protein sequence

MDRDTAAPDV TDLPGDRARE WVEYHHESAA PSTYVYEFVW DRTAPAEGPF CTDVDGNVLM 
DFTSHVAAAP LGYNNPKIME PLAEFDLVDP LKIAGQDFYV AGGESPGDGL PGSSGLMERL 
TEITAHYDMD TVFLSNSGAE AVENAIKIAY DDSGGAKHAI TFDGAFHGRT LGALSLNRSK 
SVYRRDFPEI SGIHDAPFCD DRNCTAETCS CGFFVDGASQ LRRKLDPERG HIDPDDVAYL 
ILEPIQGEGG YRFPSDAFTD EIAALVDEHD ITLIADEIQS GVGRTGEMWG SDHYALEPDV 
ITSAKGLRVG ATISRSDVFP EEKSRLSSTW GAGDIIASAQ GALTLDAIRE HDLMDNATVR 
GRQFKETMRD ADLPGVDDVR GKGLLLAVEF DSKERRDAVQ KGAFSRGLLT LACGHDVLRV 
LPPLDVTERE IELGCDLLTS AIADAA