Gene Cagg_2361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2361
Symbol
ID	7268711
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2870407
End bp	2871744
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	58%
IMG OID	643567190
Product	ABC-type dipeptide transport system periplasmic component-like protein
Protein accession	YP_002463675
Protein GI	219849242
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0243915
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAGCT TTACCAAACG GATCATGGCC GTTGCGATGA CAATGGCAAT GATCATTCCT 
ATGTTGGCGG CTTGTGGTGG TGGTGCTGCC CAACCACAAG TTATCCGCGA GACGGTGGTC 
GTCGTGCAGA CGGCTGAGCC GGTGCGTGAG ACGGTCGTTG TCACCGAAGA AGTGAAGGCC 
GAGCAATACA CCACCCCGCA CCCGATCCTC AGTGATTTGC GTGTTCGGCA GGCAATCGCC 
TACTGCACCA ATCGTCCCGA GCTGATCCAG TCGGTTTACC CCTACCTGAC GCCCGAACAG 
CAACAAGAGC TGCTGATGGA TACCTTCCTG CCGAAGGCCC ACTGGGCAGC AGCCAAAGAG 
AACATCACCA CCTATCCGTT TGACCCCGAA AAGGGCAAGG CGTTGCTCGA AGAAGCCGGC 
TGGAAGTTGC CGGAGGGTGC CTCGGTTCGC GTGAACGCGA ATGGTGAGCC GTTGTCGTTG 
AGTTTCACCA CAACGAATGC TCAGTTCCGC CAGACGTGGT CGGCAGTCTT CATCCGCCAG 
ATGGCAGCAT GTGGTATCCA GATTGTCCCG ACCTACGCTC CGGCCTCGTG GTGGTTCGGT 
AGCAGTACCG GTCTGCGCCG CCGCGACTTT GAGTTGGGTG CTTTCGCATG GGTTGGTCAG 
GCCGATCCGG GCGGCCAGAC GCTCTACGCC TGCAATCAGA TTCCGCTGCC TTCCAACAAC 
TGGGAAGGCC AGAACTACAT GGGCTGGTGC AACGAGCGGG CGAGCCGCGC GATCATTGCT 
GCGAACAACA CCCTCGACCG GGCCGAGCGC ATCCGCCAGT ACGCGATTGT GCAGGAAGAG 
TTCACCAAGG ATATGGTGAG CCTGCCGCTC TTCAACCGTC TCGAGGCGTA TGCTGCCACC 
AACCGGTTGG TTAACTTCAA GCCGAACCCG ACCGAGTACT ACACTGCTAA CGCCGACGAG 
TGGGAGTTGA CCGATAATGG CGATACTATC GTGCTGGGCT TCACCCAAGA GCCGCAGACG 
ATGTGGAGCC TGATCGAGAG CGCAGCAGTG CAGCGCGTTG CGGTCAACCT GCTGGGCGTT 
CCGGCAACAA CCACTTATGA CTACGACTAC CAGCCGGTGG GTCTTGATGG CCTCTCGACT 
ATCGAGAGTG GTCGAGCGAC CAATGCCGAT GTCGAGGTCA AAGAGGGTGA TATTGTTTGG 
AACACTGATG GCGAGGCAGT ACCGCTGGCT CCTGGTGTCG AGATCGTCAC CGCTGATGGT 
GAGACCATCA CCTATCAGAG TGGCACGGTC AAGATGAAGC AACTGACCGT CACCGATAAT 
ATGGATCTCG GGCATTAA

Protein sequence

MASFTKRIMA VAMTMAMIIP MLAACGGGAA QPQVIRETVV VVQTAEPVRE TVVVTEEVKA 
EQYTTPHPIL SDLRVRQAIA YCTNRPELIQ SVYPYLTPEQ QQELLMDTFL PKAHWAAAKE 
NITTYPFDPE KGKALLEEAG WKLPEGASVR VNANGEPLSL SFTTTNAQFR QTWSAVFIRQ 
MAACGIQIVP TYAPASWWFG SSTGLRRRDF ELGAFAWVGQ ADPGGQTLYA CNQIPLPSNN 
WEGQNYMGWC NERASRAIIA ANNTLDRAER IRQYAIVQEE FTKDMVSLPL FNRLEAYAAT 
NRLVNFKPNP TEYYTANADE WELTDNGDTI VLGFTQEPQT MWSLIESAAV QRVAVNLLGV 
PATTTYDYDY QPVGLDGLST IESGRATNAD VEVKEGDIVW NTDGEAVPLA PGVEIVTADG 
ETITYQSGTV KMKQLTVTDN MDLGH