Gene Cagg_0291 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0291
Symbol
ID	7267472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	361385
End bp	362455
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	58%
IMG OID	643565160
Product	cobalamin B12-binding domain protein
Protein accession	YP_002461674
Protein GI	219847241
COG category	[R] General function prediction only
COG ID	[COG5012] Predicted cobalamin binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACTC CCATTCCCAG CGATTTCCAG CGTCGCTATC TCGAGGCAAT GCTCCACGGC 
AACGGACGGG ACGCGGATCG TGTGGTCGAA CAGGCACTGG CTCAAGGGAT CAACGCGCCA 
CGCATCTACC TCGACATCTT CCAGCCCACC GCTTACGAGA TCGGCCGACT CTGGCAAGTA 
AATCGGATCA GCGTTGCGCA AGAACACCTC GCCACGGCGA TCATCGAACG ACAGATGGGT 
GAACTACATC CCTATTTTCG GCCCCGCCTG CGGCGTCAGC GCCGAATCGT GCTCGGCTGC 
GCACCTGATG AATGGCACCG TGTTGGTATC CGCATGGTGG CCGATTTTTT TGAAGCCGAA 
GGTTGGGACG TCATCTACCT TGGTGCAGCC GTACCGATTC CGGCGTTTGT CGATGCGATC 
AAGATCGCCC AACCCGATCT CGTCGGTATC TCGGCGGCAA TGGTGTTTCA TCTGCCACAC 
GTCACCCATC TGGTGCGAGC ATTGCACGCC GCCGATCTTG ATGGTATTCC GCTGATGGTT 
GGAGGATTGC CGTTTGTCCG TCAACCCGGC TTACACCGCG CGCTCAACAT CCACCTCAGT 
GCGCCCAACG CTGCTGCGGC AGTTGCTGCG GCTAATCATG CGTTTCCCGT TCCGATCCGC 
GTACCATCGG CGCCGCACAG CAATGCCGCA CTGCATGCCG TACAAACCCT CCATCGTCAG 
ATCATCGACC GTGCTACGAC GCTCGCTCTG CAGCACCAGG ATGAGCTACA GCTTCTTGGT 
GCGCAAGCGC CCACGATAAT CGCAGCCGGA TACGAGTTTG TCACGCGCAC CCTGGAAGCA 
GCCCTCGCTA CCGGGCAACC GGAACTGCTC GACGAACAGA TACGCTGGGG AAACGAACGA 
CAGCTCTACG ATGGGGTTAT GCCTGAACAT ATGCTACACC GCCTCGAAAT CTACGACGCA 
GTGATCCGTG AATTGCTACC GGCTGAGCTG GTTGAGATCG TCACCGTGTA TACAGAACGC 
ATGATCGCCT TACAACGTTC GCTGATCGGA AACAGCACTG CATCAGCCTA G

Protein sequence

MTTPIPSDFQ RRYLEAMLHG NGRDADRVVE QALAQGINAP RIYLDIFQPT AYEIGRLWQV 
NRISVAQEHL ATAIIERQMG ELHPYFRPRL RRQRRIVLGC APDEWHRVGI RMVADFFEAE 
GWDVIYLGAA VPIPAFVDAI KIAQPDLVGI SAAMVFHLPH VTHLVRALHA ADLDGIPLMV 
GGLPFVRQPG LHRALNIHLS APNAAAAVAA ANHAFPVPIR VPSAPHSNAA LHAVQTLHRQ 
IIDRATTLAL QHQDELQLLG AQAPTIIAAG YEFVTRTLEA ALATGQPELL DEQIRWGNER 
QLYDGVMPEH MLHRLEIYDA VIRELLPAEL VEIVTVYTER MIALQRSLIG NSTASA