Gene Gbro_4237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gbro_4237
Symbol
ID	8553618
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gordonia bronchialis DSM 43247
Kingdom	Bacteria
Replicon accession	NC_013441
Strand	+
Start bp	4533988
End bp	4535256
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	65%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003275277
Protein GI	262204069
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGACGCC TCTACCGCAG TTTCCGCAGC TTCGATCGCC CCAGCCAAGT GCTGATGGTC 
AATCAGTTCA CCATCAATCT CGGCTTCTAC ATGCTCATGC CCTACCTCGC CGCCTACCTC 
GCCGGCCCGC TGGCCCTGGC CGCATGGGCA GTGGGCCTGG TCCTGGGGAT ACGCAACTTC 
TCCCAACAGG GCATGTTCCT GATCGGGGGA ACACTCGCTG ACCGCTGGGG TTACAAACCG 
CTCATCATCG CCGGATGCCT GATGAGGGTC ATCGGATTCG TCCTACTGGC CCTGGTCAGT 
TCGCTGCCGG CGATCCTGAT CGCCTCGGCG GCAACGGGAT TCGCCGGGGC GCTGTTCAAC 
CCCGCCGTAC GGGCCTACCT GGCCGGCGAC GCCGGTGAGC GCCGCATCGA AGCATTCGCC 
GTGTTCAACG TGTTCTACCA GGCCGGGATC CTGCTCGGGC CGCTGGTCGG ACTAGCCCTG 
ACCGCCCTGG ACTTCCGGCT CACCTCTCTC TGTGCGGCAG CAGTTTTCGC GGTCCTGACC 
CTCGTGCAGA TCAAAGCGCT ACCCGCAACA ACACCTGCCC CGAGCAGCAC CTCAATCATT 
CAGGACTGGC GCAGCGTCGT CCGTAACCGG CGATTCCTGC TCTTCGCTGC GGCGATGGCC 
AGCTCTTACG TGCTGTCCTT CCAGATCTAC CTCGCCCTGC CCCTACATGC CGACCGCATA 
GCAGACAACC CCACCCTCGC CACCAGTGTT GTCACCGCAA TGTTCGTGGT GACCGGTCTG 
GTGGCCATCG CCGGCCAGCT ACGCATCACC ACATGGTTCG GCAACCGCTG GGGCAGCACC 
GGCAGCCTGA GCGTGGGAAT GACGCTGATG GCTGCAGCTT TCCTGCCCCT AGTCGCCAGC 
ACCGCAACGC ATCAGCGCAA CATCGCCCTC AACATCGCCG CCCTGCTACT CACCGCAGCT 
CTGCTCGCCG CCGCCACCGC AGCAGTGTTC CCATTCGAAA TGGACACGGT GGTGGGACTG 
GCCCGCGGCA CGCTTGTCGC CACCCACTAC GGGCTCTACA ACACCATCGT CGGGATCGGG 
ATTCTGCTCG GCAACGCCGC GACCGGGTGG CTGTTCAGCG CGGCCACCAC CCGCGACATG 
CCCGAACTGG TGTGGATCGC TCTAGTCCTC ACCGGCATGG CGGCGGCGTC TGCCCTGTTG 
CTGTTGCACC GCCGCGGATG GCTCAGTGTC GCCGCCCCCA CCGAAGCTCA GCCCACCACA 
ACCCATTGA

Protein sequence

MRRLYRSFRS FDRPSQVLMV NQFTINLGFY MLMPYLAAYL AGPLALAAWA VGLVLGIRNF 
SQQGMFLIGG TLADRWGYKP LIIAGCLMRV IGFVLLALVS SLPAILIASA ATGFAGALFN 
PAVRAYLAGD AGERRIEAFA VFNVFYQAGI LLGPLVGLAL TALDFRLTSL CAAAVFAVLT 
LVQIKALPAT TPAPSSTSII QDWRSVVRNR RFLLFAAAMA SSYVLSFQIY LALPLHADRI 
ADNPTLATSV VTAMFVVTGL VAIAGQLRIT TWFGNRWGST GSLSVGMTLM AAAFLPLVAS 
TATHQRNIAL NIAALLLTAA LLAAATAAVF PFEMDTVVGL ARGTLVATHY GLYNTIVGIG 
ILLGNAATGW LFSAATTRDM PELVWIALVL TGMAAASALL LLHRRGWLSV AAPTEAQPTT 
TH