Gene Hhal_1999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1999
Symbol
ID	4710416
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2203460
End bp	2204749
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	71%
IMG OID	639856472
Product	phosphoribosylamine--glycine ligase
Protein accession	YP_001003565
Protein GI	121998778
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0151] Phosphoribosylamine-glycine ligase
TIGRFAM ID	[TIGR00877] phosphoribosylamine--glycine ligase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00638776
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGTAC TGGTGATCGG AGGGGGCGGC CGCGAGCACG CCATGGCCTG GGCCCTGGCG 
CGCTCCAAGC AGGTCGAGGA GGTGCTGGTC GCCCCGGGGA ATGCCGGCAC GGAGCGCGAG 
CCCAAGGTGC GCAACATCCA GGTGGGGGCG GAGGATATCC CCGCGCTGGT CCAACAGGCC 
CGCGAGCAGG AGGTGGCTTT GACCGTGGTC GGCCCCGAGG CGCCCCTGGT GGCCGGCGTG 
GTGGACGCCT TCCAGCAGGC GGGTCTGGCG TGTCTGGGGC CGACGGCGGA CGCCGCCGAG 
CTGGAGGGCT CGAAGGCGTT TGCCAAGGCG TTCATGGCGC GTCACGGGGT GCCAACGGCC 
GCCTACCGCA CCTTCGACGA CCTGGGGGCG GCCAGCGACT ATATCCGCGA GCACTCGACG 
CCGATGGTCA TCAAGGCGGA CGGCCTGGCC TCCGGCAAGG GGGTCGAGGT GGCGGCGACC 
AAGGACGAGG CCCTATTGGC GGCCGAGCGC ATGCTCTCGG GGCAGGCCTT CGGGGATGCC 
GGCGCGCGGG TCGTGGTCGA GGAGTGCCTG CAGGGCGAGG AGCTGAGCTT CATCGCGCTG 
GTCGATGGCG AGCACGTGGT GGCGATGGCC AGCTCCCAGG ATCACAAGCC GCGGGACGAC 
GGAGATCGGG GCCCCAACAC CGGTGGTATG GGGGCCTATT CGCCGGCGCC GCTGATGGAT 
GAGCAGCTCT ACCAGCGGGT CATGGACGAG GTGATCCGCC CCACGGTCCA GGGGCTGGCC 
GCCGAGGGGC GCCCCTATCA GGGCTTCCTC TACGCCGGAC TGATGATCGA CGCCGACGGC 
AACCCCCGGG TGCTGGAGTA CAACTGCCGC CTGGGTGACC CGGAGGCGCA GCCGCTGTTG 
ATGCGCCTGG ACGCGGATTT TGCCGAAGTC TGCCGGGCCG CCCTCGAGGG GCGACTGGGC 
GAGGTGGATC TGGCCTGGGA CTCGCGTCCT GCTGTGGGCG TGGTGATGGC GGCGGCCGGC 
TATCCAGGGT CGGTGGAGCG GGGCGATGTC ATCGAAGGGC TCGACGACGC CGAGGCCACC 
GGCTGCAAGG TCTTCCACGG CGGCACGACC TTCGACGCCG ACGGCCGTGT GGTGACCAAC 
GGGGGGCGGG TGCTGTGCTG TTGCGCGCTG GGTGAGCGTG TCTCTGCAGC GCAGCAGGCG 
GCCTACCGGG GGGTGGCGGC CATCCATTGG GAAGGGGTGT TCTACCGGCG GGATATCGGT 
GCGCGGGCCA TCGCCCGGGA GACCGGCTGA

Protein sequence

MKVLVIGGGG REHAMAWALA RSKQVEEVLV APGNAGTERE PKVRNIQVGA EDIPALVQQA 
REQEVALTVV GPEAPLVAGV VDAFQQAGLA CLGPTADAAE LEGSKAFAKA FMARHGVPTA 
AYRTFDDLGA ASDYIREHST PMVIKADGLA SGKGVEVAAT KDEALLAAER MLSGQAFGDA 
GARVVVEECL QGEELSFIAL VDGEHVVAMA SSQDHKPRDD GDRGPNTGGM GAYSPAPLMD 
EQLYQRVMDE VIRPTVQGLA AEGRPYQGFL YAGLMIDADG NPRVLEYNCR LGDPEAQPLL 
MRLDADFAEV CRAALEGRLG EVDLAWDSRP AVGVVMAAAG YPGSVERGDV IEGLDDAEAT 
GCKVFHGGTT FDADGRVVTN GGRVLCCCAL GERVSAAQQA AYRGVAAIHW EGVFYRRDIG 
ARAIARETG