Gene Cagg_1970 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1970
Symbol
ID	7268886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2406713
End bp	2407930
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	65%
IMG OID	643566807
Product	hypothetical protein
Protein accession	YP_002463300
Protein GI	219848867
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0110365
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGGTCG TGACGGCGCG GAATCTGCCG TATCCCGCCG ATCTGCCGTT TGAGGTTCCT 
TCCGAACACG TCATCGCCAC TCCTTGGGTC GATGTCAGCA TGCCTCACAC ACTCGCCACC 
CGCCTCCGTC GCCATCGATC CAGCGTTGTG GCCCTATTCG ACAAAGCCCC CGCAGGACAG 
ATGCAGTATA CCATTGCATC ACGCCTGCTC GATGCCTACC GCGCGCTAGT TGCGTTCCCT 
GACGATGCGA TTGGCTGGTT CCCGTTCGGG TGGAACGAAG CGCAACGTCT GCTGGAGCGG 
TGGCGCCCGG ATGTTATTGT TGCCAGCAGC GCTCCACCAA CGTCGCTGCT GATTGCCAAC 
GTCCTGCATC GGCAGTATGG GGTGCCATGG GTCGGCGAAC TGCGCGATCT CTGGACAGAC 
GATCATTACT ATCCATACTC GATGTGGCGG CGCGTGCTGG AAACGTGGCT CGAATGCCGG 
ACGCTGCGCA TAGCCGCAGG GCTGGTCACC GTTTCCGAGC CGCTGGCGCG CGCTCTGCGC 
TTGCGCTATA ACCTGCCGAC AGAGGTCGTG TTGAACGGGT TCGACCCCGC CGACTATCCA 
CCGATGCGAC CGACGCGCGC CGATCCGCAG TTGACCATTG TGTACACCGG AGCGATCTAT 
CTCAACCGGC GCGCCGCACC GCTCTTCGCC GCGCTGCAAC GCCTGGGGGC GCGCGCTGCG 
CGAGTGCGTG TGACAGTCTA CAGCCACAGT ATCAGCGGCA TTGTGGCAAT CCGGTCCGAA 
GCGCAGCAGT ATGGCGTCGA ACACCTGCTC GATGTCCGCG ACGCCGTTCC GCACCGCGAG 
GCGCTGGCGC AGCAGCGCGC CGCCGATGTG CTGTTGCTGC TGTTGTGGAA CGACCCGCGC 
GAGCGCGGCG TCTACACTGG CAAACTTTTC GAGTATCTGG GAGCGCGCCG TCCAATCCTG 
GGCATCGGAC CCGCCGACAA CGTGGCGGCT GACCTGATCC GCGAGCGGCG GGCAGGGATG 
GTCTCCGCCG ATCCCGCTGA GATTGCCGGG CAACTCACGC GCTGGCTGGA TGCCAAAGAG 
CGCGGCGGCA TCCCAGACCT GCCGGCGTCG GCGTCCGCCG GATTGTCGCG CGAGGAGCAG 
ACGCGCCGCC TGGAGGCGTT TCTGGAACGT CTCGTCGGGC AACGCGAGCT ATCGGGAGAG 
CAGTCGCAGG ATGCATAA

Protein sequence

MRVVTARNLP YPADLPFEVP SEHVIATPWV DVSMPHTLAT RLRRHRSSVV ALFDKAPAGQ 
MQYTIASRLL DAYRALVAFP DDAIGWFPFG WNEAQRLLER WRPDVIVASS APPTSLLIAN 
VLHRQYGVPW VGELRDLWTD DHYYPYSMWR RVLETWLECR TLRIAAGLVT VSEPLARALR 
LRYNLPTEVV LNGFDPADYP PMRPTRADPQ LTIVYTGAIY LNRRAAPLFA ALQRLGARAA 
RVRVTVYSHS ISGIVAIRSE AQQYGVEHLL DVRDAVPHRE ALAQQRAADV LLLLLWNDPR 
ERGVYTGKLF EYLGARRPIL GIGPADNVAA DLIRERRAGM VSADPAEIAG QLTRWLDAKE 
RGGIPDLPAS ASAGLSREEQ TRRLEAFLER LVGQRELSGE QSQDA