Gene Cpha266_1849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1849
Symbol
ID	4571191
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	2142687
End bp	2144033
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	48%
IMG OID	639766431
Product	PUCC protein
Protein accession	YP_912289
Protein GI	119357645
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAAC TTAACCTGAT CCGCCTCTCC CTTTTCCAGA TGGGTTTTGG AATCATGCTC 
GGTTTTCTGC ATGATACCCT GAACCGGGTC ATGACTACGG ATCTTGGCAT CTCCTCAACC 
ATTGTGTTTG GCCTCATCAG CCTGAAGGAG CTGCTTGCGA TATTCGGCGT CAAGGTCTGG 
GCTGGCAACA TGTCCGATCG CGCGAATCTT TTCGGTCTGA AACGCACACC CTATATTCTG 
CTTGGGCTTT TTTTCTGTGT TTTTTCCTTT ATGCTCTCTC CTGCGGCAGC CTATGAGGTA 
ACTGTCGCCG GAAAAAGTTT TTCTGAACTT TTTCCGGCCA TATTTACCGA TATCGGTCTG 
TTGAAGCTTG CGGTCATTTT TCTTCTGTTT GGTTTTGGAT TGCAGGTTGC CACAACAGCC 
TACTATGCGC TTCTTGCCGA TACGGTTGGT GAAGAGAACA TTGGCAAGGT TACCGGTGCA 
AGCTGGACTC TCATGGTTCT TACTACCATT ATTGCTACAA GGGTTGTCGG CTCGTTTCTC 
GATGTCTATA CCCCCGAAAG GCTTATTACT GTTGCTGAAG TTGGTGGATC GATAGCGCTC 
TGTATCGGGC TTTTTGCCGT ACTCGGTATT GAAAAGCGAA ATGTAGTTCC TTCAGAGGGC 
AAGAGCAGGC ACTCCATCTC TTTTTCACAG TCACTGAAAC TGCTCTCTTC ATCACCGAAA 
ACCCTGCTGT TTGCTTTTTA TATCTTTATC TCGATTTTTG CGCTCTTTGC CAATGAAATT 
GTCATGGACC CTTTTGGAGG CGATGTATTC GGCATGCCGG TCGGTACAAC TACCAAGCTG 
TTCCGGCCGA CAATGGGTGG TACGCAGTTG ATTTTCATGC TGATCGTGGG ATTTCTGCTC 
AACAGGATCG GTCAGAAGCG AGGCGCGCAT ATCGGCAATT TTTTTGGTAT TATCGGCTTC 
AGCATGCTGA TTGCCGCCGG CTTCATGCGC GATGAACAGT TCCTTCGCAT TGCGCTTGTC 
GTAACCGGCA TAGGGCTTGG AGCGGCCAGC GTATCCAATA TCTCCATGAT GATGACCATG 
ACGGCAGGTC GCAGCGGTAT CTATATAGGC CTCTGGGGTA CAGCGCAAAG CCTCGCTATT 
TTTATCGGGC ATTTCGGAGC GGGTATTATT CGTGACGTGG TTTATCACCT TTCCGGAGCT 
TATGTCTGGG CTTATGCCGC TATATTTTTA ATGGAAATTA TTGCCTTTAC GATATCGAGC 
CTTGTTCTGC CCCATATTTC GAAAGAGGCG TTCGAAGCCG AAAGCAAAGC GAAAATCGCT 
GAACTGCAAC CAGCAGAAGG GGGTTGA

Protein sequence

MKQLNLIRLS LFQMGFGIML GFLHDTLNRV MTTDLGISST IVFGLISLKE LLAIFGVKVW 
AGNMSDRANL FGLKRTPYIL LGLFFCVFSF MLSPAAAYEV TVAGKSFSEL FPAIFTDIGL 
LKLAVIFLLF GFGLQVATTA YYALLADTVG EENIGKVTGA SWTLMVLTTI IATRVVGSFL 
DVYTPERLIT VAEVGGSIAL CIGLFAVLGI EKRNVVPSEG KSRHSISFSQ SLKLLSSSPK 
TLLFAFYIFI SIFALFANEI VMDPFGGDVF GMPVGTTTKL FRPTMGGTQL IFMLIVGFLL 
NRIGQKRGAH IGNFFGIIGF SMLIAAGFMR DEQFLRIALV VTGIGLGAAS VSNISMMMTM 
TAGRSGIYIG LWGTAQSLAI FIGHFGAGII RDVVYHLSGA YVWAYAAIFL MEIIAFTISS 
LVLPHISKEA FEAESKAKIA ELQPAEGG