Gene Hlac_0332 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0332
Symbol
ID	7399722
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	355679
End bp	356839
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	69%
IMG OID	643707394
Product	folate-binding protein YgfZ
Protein accession	YP_002565006
Protein GI	222478769
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0404] Glycine cleavage system T protein (aminomethyltransferase)
TIGRFAM ID	[TIGR03317] folate-binding protein YgfZ

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.97102
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0439096
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCTCG TCTCCGACAC CCACGGTGCC CACGGCGCGG TGTACCGCGA CCGCGGTGGC 
CGCCGGGTGG TGGATCACTA CAGGAAGCCC GAGCGCGTCG GCAAGGCGGT CCGCAACGTC 
GTCGGCGCAA TCGAGATGGG GTACGGCGTG CTCGCGATCA CGGGCGAGGA CCGCGTCGAG 
TTCATCGACA ACGCCGTCTC CAACCGAATT CCGGAGGCAG ACGGTCAGGG CGTGTACGCA 
CTCCTGCTCG ATCCCCAGGG CGGCATCGAG ACGGACATGT ACGTGTACAA CGCCGACGAG 
CGCCTCCTCG TCTTCCTCCC GCCCGAGCGC ACCGAGGCGG TCGCCGAGGA CTGGGCGAGC 
AAGGTGTTCA TTCAGGACGT GACGATCGAC GACATCTCCG ACGAGCTCGG CGTCTTCGGA 
GTCCACGGCC CCAAGTCGAC CGAGAAGGTC GCCTCGGTAC TCGGCGGACC GGGCGCACCC 
GAGAAACCGC TCTCGTTCGT CCGCGGATCG ATGGTCGACG CCGGCGTCAC CGTGATCGCG 
AGCGATGCGC CACTCGGCGA GGAGGGATAC GAGGTCGTCT GCGCCGCCGA GGACGCAGAA 
GAGGTGCTCG ACACCCTGCT CAACCGGGGC CTCAACGCGG CCCCGTTCGG CTACCGGACG 
TGGGACGCGC TCTCGCTCGA AGCCGGCACG CCCCTCTTCG AGTACGAGCT TGAAGGAACG 
GTGCCGAACG TCCTCGGACT CCGCAACGCC TTGGACTTCG AGAAGGGGTG TTACGTCGGT 
CAGGAGGTCG TCTCCCGCGT TGAGAATCAG GGACGGCCGA GCCGGCGTCT CATCGGACTC 
GACCTCGACG GGCTTGCCGA CGCGACCGCC GACATCGACG GCGACGCCGA CCCGGAGGGG 
TACGACGAGA TCCTGCCGTC TCCCGGCGCG GCCGTGTTCG ACGGCGACGA GGCGGTCGGC 
GAGGTGACCC GCGCGGCGGT CGGACCGGCC GCCGGCGACC CGATCGCGTT GGCGTTCGCC 
CGGTTCGACG CCGACCTCGT CGATCCCACC GTGCGCGTCG ACGGCGAAGA AGTCGCGGCG 
ACGCGCTCCG ACCTCCCGTT CCCGTCCGTC GACGGGAGCG CGCAGTCCGC GCGGCTGCCG 
ACGTATCCGA GCGACGAGTA G

Protein sequence

MTLVSDTHGA HGAVYRDRGG RRVVDHYRKP ERVGKAVRNV VGAIEMGYGV LAITGEDRVE 
FIDNAVSNRI PEADGQGVYA LLLDPQGGIE TDMYVYNADE RLLVFLPPER TEAVAEDWAS 
KVFIQDVTID DISDELGVFG VHGPKSTEKV ASVLGGPGAP EKPLSFVRGS MVDAGVTVIA 
SDAPLGEEGY EVVCAAEDAE EVLDTLLNRG LNAAPFGYRT WDALSLEAGT PLFEYELEGT 
VPNVLGLRNA LDFEKGCYVG QEVVSRVENQ GRPSRRLIGL DLDGLADATA DIDGDADPEG 
YDEILPSPGA AVFDGDEAVG EVTRAAVGPA AGDPIALAFA RFDADLVDPT VRVDGEEVAA 
TRSDLPFPSV DGSAQSARLP TYPSDE