Gene Jann_2009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_2009
Symbol
ID	3934462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	2015625
End bp	2016881
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	56%
IMG OID	637904365
Product	major facilitator transporter
Protein accession	YP_509951
Protein GI	89054500
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0610699
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.51216
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGCAT TTGTATGTTC GAGGTTTCGC GAGCACTGTT GCCCTATGCT ACCGGTCGCG 
TTGAAATCCA AAGAACTACG AAAGCTGTTT CTGGCTCAAT TACCAGCCGA TTTCGCAGAT 
TGGTTGGACT TCGCGGCCAT CGGCACGCTT CTGGCGTTCG TCTGGGATGC ACCCAGCTAC 
GCTTACGCTT TTCTTGCCGT CGGCATGGGC GCGCCGTATC TGCTCGTAGG CCCATTTGCT 
GGCGTGCTTG TTGATCGGTT GCCCATCCGC CGCGTTCTGT TCTGGAGCAA CTTTGGACGC 
GCGCTCGCCA CAGGCGCACT TTTCTTTGCC GACAACTGGG GCGTGTTGAT TTGCCTTGTT 
GCAGTCCGTG CATCCGTGGA CAGCTTCTTT ACCCCAGCAA AGCAAGCGGC CATTCAGGCT 
TTGACCACGG AAGGCGACCG CGCGTCCGCC AATGGTTTGA GCCACGGTAC CAATCAGGCG 
TCAAAGATCG TCGCCCCCGG TGCTGGAGGG ACCTTTCTGA TTTGGTTTGC ACCTGCTCCA 
ATCTTTATCG TCAACGCGAT GATCTCTGTC TCGGCGGCGG TACTGTGCCT CCGGCTGCAA 
GATATCGAAA GGAATGAAAA CCAACGGAAA TCTGAAGGGA CAGGGCTTTG GAGCGAAGTC 
AAGGAGGGGC TCGCTTACGT GCGATCGCAG GTCGTTGTCA GGACCGTTTT GCTCATGATG 
GCAGCCATGT ATTTCGCGAT GTTCATCTAT GACACCTTCA TAGCGCCCCT CGCACGCGGT 
CTTGATTTTG AACAACAGCA TTTGGGGTAC GCGCTGGCAG CTGTTGGGGC TGGCGGGGTG 
TTCGGTGCAA TTGTGTTCTC GTTCCTGGCG GAACTCAAAA AACCGCAAAG GTGGATCGCG 
GTCGGAACGT TTGTCGGGGG CGCCATGCTC CTGACGCTCG GAATCTTTGA TCTCCTGAGC 
GCATCCATGC CCCTTCAGGT TTTCATACTT CTCTTCCTAG TTTTGGGACT GACGTCAGCC 
ATGGCCGTGA TCCCAGTGCG CATCATCTTG CAAAACACTG TTTCGCCCGA CCGGATGGGG 
TCGGTAACGG CACTGAGCGA AGCCGCAAAT ACTTTGGCGC TGCTGACCGC ACCATTTGTG 
GGCGCATTGC TGGTCAGTCT CTTTTCCGTT GGAGCGCCTT TCACAGTCGG CGGTTCCATT 
CTTCTAGTTG CGGCTGTAGT GATTTCGCGC CTCGAGCTTG ATCAGTCCAA AAGCTGA

Protein sequence

MSAFVCSRFR EHCCPMLPVA LKSKELRKLF LAQLPADFAD WLDFAAIGTL LAFVWDAPSY 
AYAFLAVGMG APYLLVGPFA GVLVDRLPIR RVLFWSNFGR ALATGALFFA DNWGVLICLV 
AVRASVDSFF TPAKQAAIQA LTTEGDRASA NGLSHGTNQA SKIVAPGAGG TFLIWFAPAP 
IFIVNAMISV SAAVLCLRLQ DIERNENQRK SEGTGLWSEV KEGLAYVRSQ VVVRTVLLMM 
AAMYFAMFIY DTFIAPLARG LDFEQQHLGY ALAAVGAGGV FGAIVFSFLA ELKKPQRWIA 
VGTFVGGAML LTLGIFDLLS ASMPLQVFIL LFLVLGLTSA MAVIPVRIIL QNTVSPDRMG 
SVTALSEAAN TLALLTAPFV GALLVSLFSV GAPFTVGGSI LLVAAVVISR LELDQSKS