Gene Strop_4165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_4165
Symbol
ID	5060649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	4735674
End bp	4736924
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	69%
IMG OID	640476427
Product	major facilitator transporter
Protein accession	YP_001160972
Protein GI	145596675
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0148559
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTTGG GTCGAAATTT CGCCAAGCTT TGGTGGTCGC AGGGCCTGTC GAATCTTGGT 
GATGGTCTGG TACTGGCCGC CGTGCCCCTC CTCGCCGTCA CGATGACCCG CGACCCGCTG 
CTGGTCGCGG GGATGACCGT GGCGCAGTTC CTGCCATGGC TCCTCTTCAC TCTGCCAGCG 
GGAGCTCTCG CCGACCGCAT CGATCGGCGC CTCATCATGG TGGCGGGAAA TCTGGTCCGC 
GCGGTGGGAT TCGGACTGCT CGTCCTGACG CTCGTGGCCG ATGTACGCAG CATCGCAGTT 
CTCTACATCG CGGTGTTCCT CGCCGGCACG GCAGAGACGC TCGTGGACAA CGCGGCACTC 
ACGGTGCCGC CGCGCCTGGT GCAGCGCAGT GACCTCGAGC GGGCGAACGG ATGGCTCTTC 
GCCACTCAGT CGGCCATCAA CAACTTTGTC GGACCCACCG CGGGTGCCGC TCTGTTCGCG 
ATGTCGGCGG TCATGGTGTT CTCCTCCACA GCGGGATTCT TCGCACTCGC CGCGCTGGCA 
GCCATCATGC TGCCACGGAT GATGCCGACC GCGAGCGACT CGAGCGGTGA CAAGCACACG 
CCGGGCGAGG TTGTGCGCAG CATCAGGGAA GGCTGGTCGT ACTTCTGGAA CCACCGGCTG 
ATGCGGCGGG TGGCCTTCAT CTCTGGTTCG ATCAATCTGT TCTCGTCCGC CACCGGCGGT 
CTGCTCGTCC TCCTGGCGAC CGGTCCCTTG GGCGTGCCGG CGTCGTGGTA CGGCCTGTTC 
ATCGCCGTCC CGGCCGTGGG AGCCGTGCTC GGCTCGCTGA TCGCCGCGCG AGTGGTGCCG 
GCCATCGGCG GGGGACCGGT GACCTGGCTC GCCGCACTCG TGCCCGCCGC CAGCTATGTC 
GTCCTCGGTC TCAGCGGCAG CATCGTCCTC TCCGAGGTGG CCATGTTCCT CGCCGCGGTC 
GCCACGGCCT TGAACCAGAT CGTGGTCAGC ACGCTCCGGC AGGCTGCCGT CCCCGACGGG 
GTCCTCGGCC GGGTAACCGC CGGCTACCGT CTGATCGTGC TCGGCGCGGT GCCGGTCGGG 
GCGCTCCTCG GCGGCGGACT GGGGCGTTGG CTGGGCCCGG AGACCACCTT CGTCGTCTGC 
GGCGTCGGAC TGACCGTAGC GGCGATCGTT TTCGCCTCCC GGGTCACGAC CCGTGCCCTG 
CGCGAGGCGG AGGAGGTAGC CCGGACTGCG GCCCGTGAGC CAGCCGCCTG A

Protein sequence

MTLGRNFAKL WWSQGLSNLG DGLVLAAVPL LAVTMTRDPL LVAGMTVAQF LPWLLFTLPA 
GALADRIDRR LIMVAGNLVR AVGFGLLVLT LVADVRSIAV LYIAVFLAGT AETLVDNAAL 
TVPPRLVQRS DLERANGWLF ATQSAINNFV GPTAGAALFA MSAVMVFSST AGFFALAALA 
AIMLPRMMPT ASDSSGDKHT PGEVVRSIRE GWSYFWNHRL MRRVAFISGS INLFSSATGG 
LLVLLATGPL GVPASWYGLF IAVPAVGAVL GSLIAARVVP AIGGGPVTWL AALVPAASYV 
VLGLSGSIVL SEVAMFLAAV ATALNQIVVS TLRQAAVPDG VLGRVTAGYR LIVLGAVPVG 
ALLGGGLGRW LGPETTFVVC GVGLTVAAIV FASRVTTRAL REAEEVARTA AREPAA