Gene Cagg_3835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3835
Symbol
ID	7266315
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4674174
End bp	4675244
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	55%
IMG OID	643568646
Product	DRTGG domain protein
Protein accession	YP_002465106
Protein GI	219850673
COG category	[R] General function prediction only
COG ID	[COG0857] BioD-like N-terminal domain of phosphotransacetylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000379504
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCAACAC TGTATGTCGC CTCAACTGAG ACCTACGTTG GTAAGAGTGC GGTGTGTGTG 
GGTTTGCTGC GCCGAATGCA ACGAGATGGC TACCGTGTCG GGTATATGAA ACCGGTAAGC 
GTTTCGGTTA CTCACACGCC CGACGCGGTG CTTGATGAGG ATGCCGCCTT TATTCGCCAG 
ACCATTGGTC TTGACGCACC TATGGAGCAG GTTGCGCCGG TGCTCATTAC ACCGGGCGTT 
ATCGAGTCGA TCTTGCGCGG GCAACCCCAT TCGTTTGCGA AGACCTTGCG CGATGCCTAT 
CTGGCCGTAT CACGCCAGAA AGATGTGATG GTGTTAGAGG GGACTAATAC GTGGGCCGAG 
GGCGCGCTGG TCGATCTGAC GGCCGATCAA GTGACCGATA TGTTGCAAGC ACCCGGCTTG 
CTCGTGTGTC GCTACACTTC GACACTGTCG GTTGATACCA TTCTCAGTGT CCAACGGTAC 
GTTGGGGATC GTTTGTTGGG GGTGTTGATT AATCAGGTTG AAGAGCCGCA CCGTGAGTTT 
GTGCGGAACC GCGTTACTCC GTTTCTAGAG GGGCGTGGTA TTCCGGTGTT GGGTGTCCTT 
CCTCGCGATC GTTTGCTGTC GGGGGTGACG GTAAACGAAC TGGCTCAGCA TCTCGGCGGG 
CAAGTAATCG GTCGCCCTGA ATGGGGTGAG AAGATGCTCG ATTCCTTGAT GATCGGTGCA 
ATGGGTGCAG ATGCCAGTCT CTCGTTCTTC CGCCGGCGGG CAAATAAAGC GGTGATTACC 
GGCGGTGATC GGAGCGATTT GCAGTTGATT GCCCTGCAAA CGAGTACGAA TGCGCTGGTC 
CTTACCGGCA ATATCCGACC AACGATGCAG GTGATGGATC GTGCCGCCGA ATTGGAGGTG 
CCGATTATTC TCGTCGCCGA TGATACACTC AGCACCGTTG ATCGGGCTGA AAAGTTGTTT 
GGTCGGGTCC GGTTTCACCA AGAAGCCAAG TTGCGCCGTT TCACTGAGTT ACTTGATACA 
CACTTTGATT TTGATCGTTT GTACCGACTG CTAGGACTGA AGATTCATTA G

Protein sequence

MATLYVASTE TYVGKSAVCV GLLRRMQRDG YRVGYMKPVS VSVTHTPDAV LDEDAAFIRQ 
TIGLDAPMEQ VAPVLITPGV IESILRGQPH SFAKTLRDAY LAVSRQKDVM VLEGTNTWAE 
GALVDLTADQ VTDMLQAPGL LVCRYTSTLS VDTILSVQRY VGDRLLGVLI NQVEEPHREF 
VRNRVTPFLE GRGIPVLGVL PRDRLLSGVT VNELAQHLGG QVIGRPEWGE KMLDSLMIGA 
MGADASLSFF RRRANKAVIT GGDRSDLQLI ALQTSTNALV LTGNIRPTMQ VMDRAAELEV 
PIILVADDTL STVDRAEKLF GRVRFHQEAK LRRFTELLDT HFDFDRLYRL LGLKIH