Gene Cagg_1392 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1392
Symbol
ID	7267244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1717026
End bp	1718273
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	55%
IMG OID	643566235
Product	glycoside hydrolase family 18
Protein accession	YP_002462735
Protein GI	219848302
COG category	[R] General function prediction only
COG ID	[COG3858] Predicted glycosyl hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.282919
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGATCG GCACGACAAT CGCCGGAGCA ATCTACATTG GTGCCTTGGT CGTGGCAGGG 
CTACTGCTCT GGCAGACGGT AGAAATGTCA CGTACCCTCA TCGCGCTCTC GGCCAACGCA 
TCAACGCCAA CACCGGTACC AACGCCAATA CCGACAGCCG CGCCGTTGTT GGTGTTACCA 
ACCCCTATCC CACCAACACC CTTGCCTACC ACCGCACCGC CGCAACCGGA AACCTTTGGC 
TATCACCCCA AGAGCGGGCG ATACATTGCC GTTTGGCTAC CACCGAACTT CACCGGTGAT 
GCCCGTGAGT CGTTTTTCGC CAACGTTGAT ATTATCGACG ACATCAGTCC ATTCTGGTAC 
ACAACCGATG CTAGCGGTCG GCTGTACGGG CAGCGCGACG ACGATCTGGT GCGCATTGCC 
CATGAAAACA ACATACGAAT CATTCCCTCG ATCCACAATG TCGGCAATCC CGGTGCGGTT 
GTACCGGTGT TAACCAATCC ACAGCTCCGT GCGCGCCATA TTCAGAATAT CGTTGATGAA 
GTACTGGCTC GCGGCTACGA CGGCATCGAC ATCGACTACG AATCGCTAGA TCCCTCGCTG 
CGCGACGATT TTACCGCGTT TATCATTGAC CTGGCTGCTG CGCTACACGC ACACAACAAA 
CTCTTGACCG TCGCCGTTCA TGCTAAAGAC CGTGATGATG GCGGCTTAGG GGCATTCCAA 
GACTGGCGAG CGATCGGACC GCATGTTGAT CAATTGCGGA TCATGACCTA CGATTATCAT 
TGGCGCGGCT CAGGACCAGG ACCGGTTGCA CCGGCCTACT GGATTGAAGC GGTAGCCAAT 
TACGCTCGTG AAGTTGTTGA TCCGGCCAAA GTGTTGATCG GTGTTCATTT CTATGGCTAC 
GACTGGCCAC CCAACGGCAA CGCAACGGCA CGTCCATGGC GTGTGATCGA GGAGATTATC 
AACGAGTATC AACCGACGGT AAGCTTCATT GAACGGAATG CACGTGGTCG GGTCGGTGAG 
AGCACCTTTA CCTATCGCAC GAGCGCCGGT ACGCGCACCG TCTGGTTTAT GACCGATACC 
GGTCTCGCCG ACAAAATTAC CACCGTGCAG AAGCTTGATC TGGCCGGCAT TGCCATTTGG 
CAATTGGGGT ACGAACGTCC TGAATATTGG CAAACAGTAC GAACCAATCT CGTGCAGGAT 
TCAACGTTGA TACAACGCGC ATTAAACACC TTGTTACCAG ACCCCTAG

Protein sequence

MRIGTTIAGA IYIGALVVAG LLLWQTVEMS RTLIALSANA STPTPVPTPI PTAAPLLVLP 
TPIPPTPLPT TAPPQPETFG YHPKSGRYIA VWLPPNFTGD ARESFFANVD IIDDISPFWY 
TTDASGRLYG QRDDDLVRIA HENNIRIIPS IHNVGNPGAV VPVLTNPQLR ARHIQNIVDE 
VLARGYDGID IDYESLDPSL RDDFTAFIID LAAALHAHNK LLTVAVHAKD RDDGGLGAFQ 
DWRAIGPHVD QLRIMTYDYH WRGSGPGPVA PAYWIEAVAN YAREVVDPAK VLIGVHFYGY 
DWPPNGNATA RPWRVIEEII NEYQPTVSFI ERNARGRVGE STFTYRTSAG TRTVWFMTDT 
GLADKITTVQ KLDLAGIAIW QLGYERPEYW QTVRTNLVQD STLIQRALNT LLPDP