Gene Clim_1522 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1522
Symbol
ID	6355779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	1643794
End bp	1645074
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	49%
IMG OID	642669128
Product	major facilitator superfamily MFS_1
Protein accession	YP_001943551
Protein GI	189347022
COG category	[R] General function prediction only
COG ID	[COG2270] Permeases of the major facilitator superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.101861
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACGCAGA AGCTCAAAGT GTTTTCATGG CTGCTGTTTG ATTTTGCCAA TACGGCATTC 
AGTGTCATGA TGGTGACCTT TGCTTTTCCT CTTTATTTCA AGAATGTGAT CTGTGGCGGG 
GCTCCCTCAG GCGATGCAAT GTGGGGGATA AGTGTCAGCG TCTCGATGTT GTTTGTCGCG 
GTGATCTCTC CGGTACTCGG TGCCGCTTCG GATTATTCCG GCAGGCGCAA ACGGTACCTT 
TTTTTCTTTA CCCTGCTTTC TGTAGTTGCA ACGGCGTTGC TCGGCTTTTC GGCACCGGGT 
ATGGCTATTG CCGCGGCTCT GCTTTTTATA CTCGCAAACA TGGGATTTGA GGGAGGGCTG 
GTTTTTTATG ATGCATATCT CAAGGAGATA GCTTCGGATA AAAGTATCGG CAGGGTATCC 
GGTTACGGTT TTGCGATGGG ATATCTTGGC TCGCTCACCA TTCTGCTGCT TATGATGCCC 
CTGCTCAGTG GCGGTATTGT GCCGCAAAAC GCGTCCAGTA TCCGTACTGC TTTTATGGTG 
ACAGCGTTAT TTTTTGCGAT ATTTTCACTT CCCCTTTTTG TTGTGCTTCG TGATGAAAAG 
AAGCGCGATG TCCGCGCTCT TTCCATGGGA TTGATCGTAC GTTCCATAAA AGAGGTGAAG 
CATACGGTTG GCCACATCAT GCATTATCCT GATCTTGCCC GCTTTCTTCT CGCCTATTTT 
TTCTATAACG ACGCCATTCT CACCATTATC GCGTTTTCAT CGATTTATGC CCAGAATACG 
CTTGCATTCA CAACCAGGGA ACTGATAATC TTTTTTATGC TGGTGCAGAC TACAGCTATT 
GTCGGGTCGG TTGTATTCGG GTTTATTACC GATTGGATAG GTCCGAAAAG AACCATTGTC 
TTTACCCTCA TGATCTGGTT TGGCGTGGTT CTCGCTGCGG TATTTGCCGA CAGCAAAGTG 
CTGTTTTTCG CAACCGGCAT GCTGGCCGGT ATGGCTATGG GGTCTTCGCA GGCAGCTTCC 
CGATCAATGA TGGCAAAACT GACTCCCCGT GAACATGTTG CCGAGTTTTT CGGTTTTTAT 
GACGGGACCT TCGGAAAGGC TTCGGCGATA GTCGGCCCTC TTGTATTCGG TATGGTTTCG 
GCGCAGGCAG ACAGTCAGAA AGCAGCGCTC TCTTCACTGC TTGTTTTCTT TGTGATCGGT 
CTTGTTCTGA TGCTGCGGGT CAGGTCGCAG GGTATGACGG TGAGTGACCA GCACTCCATA 
ACGGGGGCAA CGCGTTTATA G

Protein sequence

MTQKLKVFSW LLFDFANTAF SVMMVTFAFP LYFKNVICGG APSGDAMWGI SVSVSMLFVA 
VISPVLGAAS DYSGRRKRYL FFFTLLSVVA TALLGFSAPG MAIAAALLFI LANMGFEGGL 
VFYDAYLKEI ASDKSIGRVS GYGFAMGYLG SLTILLLMMP LLSGGIVPQN ASSIRTAFMV 
TALFFAIFSL PLFVVLRDEK KRDVRALSMG LIVRSIKEVK HTVGHIMHYP DLARFLLAYF 
FYNDAILTII AFSSIYAQNT LAFTTRELII FFMLVQTTAI VGSVVFGFIT DWIGPKRTIV 
FTLMIWFGVV LAAVFADSKV LFFATGMLAG MAMGSSQAAS RSMMAKLTPR EHVAEFFGFY 
DGTFGKASAI VGPLVFGMVS AQADSQKAAL SSLLVFFVIG LVLMLRVRSQ GMTVSDQHSI 
TGATRL