Gene Cagg_1981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1981
Symbol
ID	7268897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2420055
End bp	2421347
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	42%
IMG OID	643566815
Product	hypothetical protein
Protein accession	YP_002463308
Protein GI	219848875
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0161079
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTAA AAATACTCAT AGTAACCGCG TTTTTTCCAC CTCTAAACAT GATCTCTTCG 
CTGAGAACCT ACTCGTGGGC AAAATATTGG TCTCAGCTAG GATGTGAGGT AACCGTTCTC 
ACTACACCAA AAGAACCACG ATACTCCACA ATTAACTTGC CAAGGGGAAA TTATCAGGTT 
GTAGAAGTGC CGGTTCCATT TTTTACCGAC ATTGGCCGGC AATACGTTCA TAATCCAAAA 
TATGCCGGGA TATTCCAAAA ACTAAAACAT ACTAGCGTCG TCCAAAGATT GAGGATGAAG 
GCAGGGGCAT TTAATGGTTC GCGGATGCCC GATATACACG ATCTCTGGGC GCTGAAAGTT 
GTGTCCTTCC TTAAAACAGT GCAATGGGAT GTGGTCGTTA CAACTGGTGG ACCATACAGC 
GTTCATATTA TTGGTTTCTT CCTCAAGAAA CGAGGTCTAG TGCGACGATG GATAGTAGAT 
TGGCGTGATT TATGGACGGA TAATCCCATA GCTGATGGCC TTCCCATACT TCGACAAATA 
GAAAGAAATA TTGAAAACAC ATTTCATCGA ACATGCGATA TTATTACTAC TGTATCGCCA 
CCCTTAGCTC GTATACTCAG AGAAAGTACA ACTAAACCGG TACACGTTAT CTATAACGGG 
TTTGATCCTG ACGACTACTT ATCACTTCCA ACTCAGCCAA TATTTCCTGA AGATGGAATT 
TTCCGTATTG TGTATACAGG TTCGATCTAT GAAAAGCGAG ATCCTCGTCC ATTATTCCGT 
GCTATCAAAC AGCTTGAAGA TCAGAACATC TTGGTCAATA ATCCCCTGAA AGTTATCGTT 
GCTGGATATT ACTTTCCCTT TCTTGATCTC ACTATTAAAC AGGAGAATGT CAAACAATAC 
GTTGAATTCA GAGGGTTAGT TGCAAGACCT GATTCGTTAC GCATGCAACG GGATGCAGAT 
GCATTATTAC TTTTGGATAT GAAAGCGGAG GGTATATTGA CCGGTAAAGT TTTTGAATAT 
CTCGTTGCCG GACCACCCAT CCTCGTTGTA GGTGGAGATG CTCAATCAAG TGCCGGAGCA 
CTCGTAGAAG AGTGTAAACG AGGAAGAAAC TATCAAACGG ATGTAAAAGC ACTGGCATCG 
GATTTGATCC ATCTGCTTCA TGAAAAACGA CACAAAAGAG ATACAGGAAA CAAATCAATA 
AATATCGCAA ATCTCGCACC GGAAATACTT CAGTTTTCAC GGGAACAACA AGCAAGGAGA 
ATGCTAGATA TCATCCGAGA AATTGGAGTA TGA

Protein sequence

MKLKILIVTA FFPPLNMISS LRTYSWAKYW SQLGCEVTVL TTPKEPRYST INLPRGNYQV 
VEVPVPFFTD IGRQYVHNPK YAGIFQKLKH TSVVQRLRMK AGAFNGSRMP DIHDLWALKV 
VSFLKTVQWD VVVTTGGPYS VHIIGFFLKK RGLVRRWIVD WRDLWTDNPI ADGLPILRQI 
ERNIENTFHR TCDIITTVSP PLARILREST TKPVHVIYNG FDPDDYLSLP TQPIFPEDGI 
FRIVYTGSIY EKRDPRPLFR AIKQLEDQNI LVNNPLKVIV AGYYFPFLDL TIKQENVKQY 
VEFRGLVARP DSLRMQRDAD ALLLLDMKAE GILTGKVFEY LVAGPPILVV GGDAQSSAGA 
LVEECKRGRN YQTDVKALAS DLIHLLHEKR HKRDTGNKSI NIANLAPEIL QFSREQQARR 
MLDIIREIGV