Gene Cagg_1254 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1254
Symbol
ID	7266240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1539704
End bp	1540672
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	56%
IMG OID	643566096
Product	folate-binding protein YgfZ
Protein accession	YP_002462598
Protein GI	219848165
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0404] Glycine cleavage system T protein (aminomethyltransferase)
TIGRFAM ID	[TIGR03317] folate-binding protein YgfZ

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAGTG TTGTCGCGCA TGACTATGAA GCGGTGTATA CCACCGCTGC GGTTATTGAT 
GAGTCTGACC GAGGGCGACT CTGGATGCGA GGTCGTGATC GGGCGTCGCT GTTGCATCGC 
CTCTCGACGA ACCATATCGC GCGACTTCAA CCCGGTCAGG GGACATTGAC GGTCCTCACG 
ACGCCAATCG GTCGCATGAT CGACCTGCTA CGGGTGTATG CCCTTCCCGA TGCACTCTTG 
CTGGAAACGG GACCGCGTCA TGGCGGGCCA ATCTTGCGTC ATTTGCGTAA AAATATCTTT 
TTTAACGACC AGGTCACCGT TGCAGATGCC GGTAGTGAAT TGGGTCAGAT CGGTATCTAT 
GGGCCGCAGG CGGGTGAGAT TGTGCAAGCT CTTGGTTTAC CGATGGTCGC GGAACGCTAT 
GGGATCGTTG CTGCGCAGTG GGGTGAGACA CCGGTATTGA TCGCCCGTTG TGAGCCGCTC 
GGTGGTGATG GCTATACCCT TTATCCGCCG GTAGCCCAAA CCGAGGCGTT GCTGGCTGCG 
CTGGTTGCTG CCGGTGCTGC GCCACTTAAT GCTGAAACCG CTGAGGTAGT GCGTATCGAA 
CATGGGTATC CACGCTTTGG GCATGAAATT ACCCTCGACT ACATTCCGCT TGAGGCCGAT 
CTGTGGCGTG CGGTGAGTTT TCAGAAGGGT TGCTACGTCG GCCAAGAGAT TATTGCACGG 
ATGGAGAGCC GGGGTCGGAT TGCTAAGCAG TTGCGCGGGT TGCGATTGAC GGCACTGCCG 
ACAATCGTAC CGACTCCACT CACAGTTGAT GGTAAAGAAG TTGGTGTTCT CACCAGTGCT 
GCCCACTCAC CACGATATGG TCTGATCGGG TTGGCGTATG TGCGGAGTAG TTACGCCGAT 
GACGGTACAA CGGTGTTGGT TGCCGATCAA GTGGCAAACG TGTGCCGGTT GCCCTTTACC 
GCTGAGTAG

Protein sequence

MNSVVAHDYE AVYTTAAVID ESDRGRLWMR GRDRASLLHR LSTNHIARLQ PGQGTLTVLT 
TPIGRMIDLL RVYALPDALL LETGPRHGGP ILRHLRKNIF FNDQVTVADA GSELGQIGIY 
GPQAGEIVQA LGLPMVAERY GIVAAQWGET PVLIARCEPL GGDGYTLYPP VAQTEALLAA 
LVAAGAAPLN AETAEVVRIE HGYPRFGHEI TLDYIPLEAD LWRAVSFQKG CYVGQEIIAR 
MESRGRIAKQ LRGLRLTALP TIVPTPLTVD GKEVGVLTSA AHSPRYGLIG LAYVRSSYAD 
DGTTVLVADQ VANVCRLPFT AE