Gene Cagg_1897 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1897
Symbol
ID	7266388
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2327358
End bp	2329022
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	58%
IMG OID	643566734
Product	extracellular solute-binding protein family 5
Protein accession	YP_002463228
Protein GI	219848795
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGATTG TGGTGAGTGT GTGGCTGGCA GCTTGTGGTT GGACGGTTCC TCCCACGCCG 
GTCGTACCGG AACCACCGAC ACCAACCCTA CCGCCAACAC CATCACCGTT ACCGCGAGGT 
GGAGTACTCA CCCTGCGCAT TGGCGCTGAT ATTACCGATA TACGACCGTG GCAGCCCCGT 
TCACGAGGTG AGGAATATCT GATCGGTTTA CTATACAGTG GGTTGATGCG GCTTGATGCC 
GATCTCTGGC CAACTCCCGA TCTGGCCGAA CGACTTGATA TTGATGCAAG CGGTCGCGTC 
TTGACCTTCA CCTTGCGCCC TAATTTACGC TGGCACGATG GTCAACCACT GACTGCCGCC 
GATGTGCTCT TTACCCTCGA AGCGTTGCGT AATCTACCCG AAACCAGTAC CGCATTGTTA 
GCCGATTTAC GCTATATTGT CACCGCTTCG GCCATTGATG AGCGCACGGT CGTCATCGAA 
CTACGGAGTC GTTATGCGCC GATGCTTAGC TTATTGGCTG TGCCGATCTT GCCGCGCCAC 
CTCTTCGCCG ATCGTGATGT AAGCAAGATC AACTTTCTCG ATCAGCCGAT CGGGAGTGGT 
CCGTTTCGCT TGATCGAACG GCAAGCAGGT GTGAGTTTGA CCCTCGAACG CTTTGAGCAG 
TATCACCACG GGGCACCGTT GTTAGATCGG GTGGTGTTGT CGGTGATCCC AGAAACGGTG 
CTGGCCCAAC GTGCGTTGCG CGATGGTCAA TTGCTTGTGG CCGAATTGCC GTGGGGCGCG 
CAAGAGGCGC TCGCCGATGT AGCTTCCTTG CGCAGCGGCA GTATTCCCGA AAACGGGGTC 
TATTTTCTGG CGTTTAATCT CCGTCCTGGT CGGCCATTTG CCGATGTGCG CTTGCGACAA 
GCTTTAGCTA CGGCTATTGA TTTGCCGCGT TTGGTAGAGA CGGCGACCAA AGGCAGCGGA 
ATACCGGTAG GGAATGGCGC GGTGCCGGGG AGTTGGGCGG ATATGACACC ACCGGTAACG 
TCGGGTGATT TGCCGGCGGC ACGCGCATTA CTCGATGCCG CCGGTTGGAC GTTGCCGCCG 
GGAGCTACGA TCCGTCAGCG CGAAGGCGTA CCGCTGATTG CCCGCCTTTA TGTGCGCAAT 
GACGACGAAC GGCGGGTCGT GGCAGCCCGG CGGATTGCCG AGATCGCTGC CAGTATTGGG 
ATACAGATTG AGGTCGAGCC GGTCGATTTC GCCACCGTCA TACTCGCACG CTATGTTGCC 
CCCTACGACT TCGATCTCTT GTTAGGCAGT TGGCTCAACG GAGCCGGTGA CCCGACGTTC 
GGCGATACGA TGTTCTACGA TCCCGACGAT TTTGCCCTCT TTCATTCTAG CCAGCTCGAA 
CAAGGGCCGG CTGATACACG GGTGACACGC AATTTCGTCG GATTTAACGA TCCGATCTAC 
GATGAACAAG CATTGATTGC ACGCCAACTC TACGGCCGGG AAGAGCGGCG CAGCGCCATC 
GCTCAGGCGC AGAGCCGGAT CGCCACCGCA TTGCCCTATC TCTACCTGTG GGTCGACCGA 
ACCGCCGTAG TGCTCGCTAC GCGCCTGTAC ACACTCGATG GGCCAATCGA TCTGAGTACG 
CCGCGCTTTT TGTGGAATAT CGAGCGCTGG TATCTTCAGC CGTAA

Protein sequence

MLIVVSVWLA ACGWTVPPTP VVPEPPTPTL PPTPSPLPRG GVLTLRIGAD ITDIRPWQPR 
SRGEEYLIGL LYSGLMRLDA DLWPTPDLAE RLDIDASGRV LTFTLRPNLR WHDGQPLTAA 
DVLFTLEALR NLPETSTALL ADLRYIVTAS AIDERTVVIE LRSRYAPMLS LLAVPILPRH 
LFADRDVSKI NFLDQPIGSG PFRLIERQAG VSLTLERFEQ YHHGAPLLDR VVLSVIPETV 
LAQRALRDGQ LLVAELPWGA QEALADVASL RSGSIPENGV YFLAFNLRPG RPFADVRLRQ 
ALATAIDLPR LVETATKGSG IPVGNGAVPG SWADMTPPVT SGDLPAARAL LDAAGWTLPP 
GATIRQREGV PLIARLYVRN DDERRVVAAR RIAEIAASIG IQIEVEPVDF ATVILARYVA 
PYDFDLLLGS WLNGAGDPTF GDTMFYDPDD FALFHSSQLE QGPADTRVTR NFVGFNDPIY 
DEQALIARQL YGREERRSAI AQAQSRIATA LPYLYLWVDR TAVVLATRLY TLDGPIDLST 
PRFLWNIERW YLQP