Gene Cagg_3131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3131
Symbol
ID	7269880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	3790400
End bp	3791758
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	56%
IMG OID	643567952
Product	PUCC protein
Protein accession	YP_002464425
Protein GI	219849992
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.400987
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTCTGC TCCGTTTCGC CGTCAAGACC TTTCGCCTCT CGCTTATGCG GGTAGGCGCC 
GGATGGATGT TCGCCCTTCT TACTTTCAAC TTCAATCGCG TGACCATTGC TGACCTCGGC 
GCAATGGCGG TAATCGTCAC CACATTGATC GGACTACACC ACTTCATCTC GTTCTTCCAA 
GTGTATTGGG GCCGCTTCAC CGACCGCTAT CCTATCTTCG GTCTCCGGCG CACCCCATAC 
GTCATCTTGT CAAATATCGG CGCAGCGTTG ATCTTCATGG CGCTTCCCAG TATTGCCATC 
GGTCTTGGTG AGCGTTCACT ACTCGCAACA ATTGAGGCAT TTGCCTTGAT CTTCCTGTTT 
GGTGTGCTGA TGGCAATGAA CGGCAGCTCG TCGAACGCTC TTATCGCCGA AGTGACGACC 
CCTAAGGAGC GCGGAGCAGT CGTCGCATTT ATCTGGGCGA CGGTCATTAT CAGTGGGATT 
GTGTCGGCCG GTGTGTCACG GGCGATTATG CCCCAATACT CACCTGAATC CATGCAATTC 
CTCTACAACC TTACCCCGAT TATCGTCACG GTGACCGTCC TACTGGGTGT ACTTGGCCTC 
GAGAAGCCGA TCTCGAAAGA GGAACACCGC AAATTGCTCA TAGCAGCTCC AGAAAAGGGT 
GAGGCCGGCC CAATCGAGAC GTGGCGGGTA GCGACGAGTC TGATGGGGCG CAACCCACAA 
GTGCGCGGAT TTTTCCTCTT TGTACTGCTT GCGATTTTCG GTATCTTCCT TCAGGATGCC 
ATTCTTGAGC CATTTGGTGC GGAAGTCTTC AATATGCCAC AAAAAGACAC CGCTGCCTTC 
CAACAGATGT GGGGCGCCGG CGCGTTGCTC GGCATGCTCG TGATTGGCAT TTTGTCGAGC 
ATCTTCCCCA TTTCCAAGAA GACGATCGCG ACGGTTGGCG GCTTGGGTGT CGCCGGCGGG 
TTGGCGATGT TGTCCATCTC GGCCCTGACC CACCAGCAGG GCGTGATTAT GCCGGCACTG 
ATGATTATGG GGCTTGGCAT CGGCCTGTTC GACGTCGGCG CACTCGCTAT GATGATGGAA 
ATGACGGTTG AAGGTCAGAC CGGCCTGTAT ATGGGGATGT GGGGCATGGC GCAGGGTCTT 
GGCAACGGCT TCGCGAACGT AATTAGCGGC TTGGGCCATA CGGTGATGAT CGAGGGCGGC 
ATCGTATCGC CGGCGATTGG TTACGGGCTT GTCTTTGGCC TCGAAGCCTT ACTGATGGTG 
ACAGCCATCG GCATCTTGCG TGGCATCTCG GTGCAGGAGT TCAAGGGTCT TACCCGACAA 
GATATTACGA CGGCATTGGC AATGGATACG GCCTCTTAA

Protein sequence

MGLLRFAVKT FRLSLMRVGA GWMFALLTFN FNRVTIADLG AMAVIVTTLI GLHHFISFFQ 
VYWGRFTDRY PIFGLRRTPY VILSNIGAAL IFMALPSIAI GLGERSLLAT IEAFALIFLF 
GVLMAMNGSS SNALIAEVTT PKERGAVVAF IWATVIISGI VSAGVSRAIM PQYSPESMQF 
LYNLTPIIVT VTVLLGVLGL EKPISKEEHR KLLIAAPEKG EAGPIETWRV ATSLMGRNPQ 
VRGFFLFVLL AIFGIFLQDA ILEPFGAEVF NMPQKDTAAF QQMWGAGALL GMLVIGILSS 
IFPISKKTIA TVGGLGVAGG LAMLSISALT HQQGVIMPAL MIMGLGIGLF DVGALAMMME 
MTVEGQTGLY MGMWGMAQGL GNGFANVISG LGHTVMIEGG IVSPAIGYGL VFGLEALLMV 
TAIGILRGIS VQEFKGLTRQ DITTALAMDT AS