Gene Francci3_1768 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1768
Symbol
ID	3903998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2102801
End bp	2104114
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	67%
IMG OID	637879106
Product	major facilitator transporter
Protein accession	YP_480873
Protein GI	86740473
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.160661
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCGACCC CCCATAACCG GGACCGGTCG GCGCTACGGA TCCTGCTGAC GAGCATGATC 
GGCAGCGCCA TCGAATGGTA CGACTTCTAC CTGTACTCCA CCGCGTCGGC GCTGGTACTG 
GGGCCGCTGT TCTTCCCTAA GAGCTCGCCT CAGGCCCAGA TCCTGGCTGT GTTCGCGACC 
TACGCAGCCG GCTTTCTGGC CCGGCCAATC GGTGGCCTGC TTGCCGGACA CCTCGGCGAC 
CGGGTCGGGC GCAAGTCGAT CCTGGTGCTG ACTCTCGGCG TGATGGGGAT GGCCACGTTT 
CTCGTCGGCC TGCTGCCTAC CAGCAACCAG GTCGGGGTGC TGGCCCCCGC GCTGCTGATC 
GTGCTGCGCG TGTTGCAGGG GATCGGCATC GGCGGCGAGT GGGGCGGCGG GGTGCTGCTG 
GCGGTGGAGA ACGCCCCACC GGGCCGGGGC GGATGGTACA GCAGCTGGCC GCTGCTGGGG 
TTCCCGGTCG GCCTCGCGTT GAGCACCCTC ACCTGGACGG CGCTGGCCCA GCTGCCCAGG 
CAGGAGCTAC TGTCCTGGGG CTGGCGTCTC CCGTTCCTGG CCTCTGTGGT GCTGGTGGGC 
ATCGGACTGT ACGTGCGACT GGGCATCGCC GAGACCCCTG AGTTCAGCCA GGCCAGGGCC 
GCGGGCGAGG TGGTGCGGCT ACCGGTGGCA CAGGTCCTGC GCGAGCAGCC GCGCCACGTG 
CTGTGCGGGC TACTGGCGGC GCTCGGAGTG GGCAGCACGG TCTCGCTCTA CAGCGTCTTC 
CTGCTGTCCA CCGTGGCCAC AGGAGGTGGT CGCCACGATG TCGCGCTGAC TGCACTGGTC 
ATCAGCGCCG CGTTGCAGTG TCTCTCGATA CCGCTGTTCG CCACACTGTC GGATCGGATC 
GGGCGCAAAC CATTGATGGT GTTCGGTTAC GCGGTCGCCG CAGCGACCAC CGTCCCGGCG 
CTGCTGTGGT TCGACAGTGG AAACCTACTC GCGGTGAGCG CAATCTACGT CATGGCCATA 
TCGATCGGGC ACGGCGGCTG CTATGGTAAT CTCGCGGCAT TCCTCTCCGA GCTGTTCCCG 
CCTACCCGGC GATTCTCCGC GCTTGCGGTG ACGTACCAAG TTGGTGTCAC CGTCGCCAGC 
TTCCTCCCGT TGGCCGCCAC AGCGATTGCC TCCGGCACGC GCATGACCGT CGATGTCGCA 
CTGCTGTTCT GCGGTGTCGC CACCGTCGCC GCGATCGCGA CTTCCCTGGC ACCCCAACCT 
TTCATGCCAT CCACCACCAC CCCCGTAGGC GATCATGTAG CTACCGTGAG CTAA

Protein sequence

MPTPHNRDRS ALRILLTSMI GSAIEWYDFY LYSTASALVL GPLFFPKSSP QAQILAVFAT 
YAAGFLARPI GGLLAGHLGD RVGRKSILVL TLGVMGMATF LVGLLPTSNQ VGVLAPALLI 
VLRVLQGIGI GGEWGGGVLL AVENAPPGRG GWYSSWPLLG FPVGLALSTL TWTALAQLPR 
QELLSWGWRL PFLASVVLVG IGLYVRLGIA ETPEFSQARA AGEVVRLPVA QVLREQPRHV 
LCGLLAALGV GSTVSLYSVF LLSTVATGGG RHDVALTALV ISAALQCLSI PLFATLSDRI 
GRKPLMVFGY AVAAATTVPA LLWFDSGNLL AVSAIYVMAI SIGHGGCYGN LAAFLSELFP 
PTRRFSALAV TYQVGVTVAS FLPLAATAIA SGTRMTVDVA LLFCGVATVA AIATSLAPQP 
FMPSTTTPVG DHVATVS