Gene Francci3_1554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1554
Symbol
ID	3904786
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1863193
End bp	1865025
Gene Length	1833 bp
Protein Length	610 aa
Translation table	11
GC content	67%
IMG OID	637878891
Product	major facilitator transporter
Protein accession	YP_480659
Protein GI	86740259
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.30485
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGACTT CCGACACCGC CGCCGGCACC CTGTCGCTTG AGGCCGACGA GGTCCTGGCC 
CGGCCCGGTC CGGACAACTA CAAGTGGATC GCGCTGTCGA ACGCGACCAT TGGCATCCTG 
ATGGTGACGA TCAACAGTTC GATTCTTCTC ATCGCCCTTC CGGATATCTT CCGGGGAATC 
GAGATAGACC CGCTCGCACC GGAGAACACC TCGTACTTCC TCTGGATCCT GATGGGATTC 
CTGCTGGTCA CCTCGGTGCT CGTGGTGAGT CTGGGGCGGG TCGGCGACAT GTTCGGCCGG 
GTGCGGATGT ACAACCTCGG CTTCGCGATC TTCACGCTGT TCTCGATCCT GCTCGCCGTC 
ACCTGGATGC ATGGCACGGC AGCCGCCTGG TGGATCATCA TCATGCGGGT GCTGCAGGGC 
GTGGGCGGTG CCTTCCTCTT CGCCAACTCC AGCGCGATCA TCACTGACGC CTTCCCGGAG 
GACGAACGCG GGCTCGCCCT GGGGGTCAAC GGCGTCGCGG CGATCGTCGG ATCATTTCTG 
GGGCTGTTGA TCGGCGGTCT GCTGGCGCCG GTCGAATGGC ATCTGGTCTT TCTTGTCTCG 
GTGCCGTTCG GCATCTTCGG GACGGTCTGG GCCTACCTGA AGCTGCGCGA CAACGGGGCG 
CGCACCCAGG CCCGGATCGA CTGGGCCGGC AACATCACGT TCGCGGTCGG CCTCATCGCG 
ATCCTGACCG GCATCGTCTA CGGGCTGCAG CCCTATGGCG GTCACACGAT GGGCTGGACC 
AAGCCGTTCG TGCTGAGCTG CCTGTTCGGT GGTCTCGCGG TGCTGATCGG CTTCGTCGTC 
ATCGAGCTGC GCTCCGCCGA CCCGATGTTC CGCCTGGACC TGTTCCGGAG CCGGACCTTC 
ACCATGGGCA GCATCGCGGC TCTGCTCGGC GCGCTCGCCC GTGGTGGTCT GCAGTTCATG 
TTGATTATCT GGTTGCAGGG GATCTGGTTG CCGCTGCATG GCTACAGCTT CGAGAAGACC 
CCGCTGTGGG CCGGCATCTA CCTGATTCCG GTGACCGTCG GATTCCTGGT GGCGGGGCCG 
CTGGCCGGCC GGTTCGCGGA CCGCTACGGT GCGCGTCCGT TCGCCACCCT GGGACTGGTG 
ATCACGGCGG TGGCGTTCCT GCTGTTCGAC GCCATTCCCA TCGACTTCGA CTATCCGTGG 
TTCGCGCTGA TCCTGTTGCT GATGGGCCTG TCCATGGGCC TGTTCGCGGG GCCGAACACC 
AGCAGCGTGA TGAACACCCT GCCGCCCAAC CAGCGCGGTG CCGGTGCCGG CATGCTCAAC 
ACGTTCCAGA ACTCGGCCAG CGTGCTGTCC ATCGGTGTTT TCTTCACCAT CATCGCGCTC 
GGGCTGGCCG CCAGCCTTCC GGACGCCATG TACTCCGGGC TTGTCGGGCA GGGCGTCTCC 
CCGGCGAAGG CGCACGAGCT GGCGAACCTG CCGCCGATCG GCAGCCTGTT CGCCGCGTTC 
CTCGGGTACA ACCCCACCGA GCGACTGCTC GGCCCGGACA CCCTGTCGCA GCTCGACCCG 
GCGAAGGCCG ACTTCCTCAC CGGGCACACC TTCTTCCCGA ACCTCATCTC CGGGCCGTTC 
GGTGACGGTC TGCGCCTCGC CTTCGCCTTC GCCGCCGTCG CCTGCCTGGT CGCCGCGGGC 
TTCTCCTGGC TGCGCGGGAA GCAGCGGCCG CACGTGCGCC GTCCGCTGCT CGAAGAGACG 
GCCGAGGGGC TGGCCGGCGC GGGCGACATC GCGGCGATGG AGGACGGTGC CGGGAGCGCT 
CTTTCGAGCA GCCCCCTGGC CGCCGAGCGA TAG

Protein sequence

MTTSDTAAGT LSLEADEVLA RPGPDNYKWI ALSNATIGIL MVTINSSILL IALPDIFRGI 
EIDPLAPENT SYFLWILMGF LLVTSVLVVS LGRVGDMFGR VRMYNLGFAI FTLFSILLAV 
TWMHGTAAAW WIIIMRVLQG VGGAFLFANS SAIITDAFPE DERGLALGVN GVAAIVGSFL 
GLLIGGLLAP VEWHLVFLVS VPFGIFGTVW AYLKLRDNGA RTQARIDWAG NITFAVGLIA 
ILTGIVYGLQ PYGGHTMGWT KPFVLSCLFG GLAVLIGFVV IELRSADPMF RLDLFRSRTF 
TMGSIAALLG ALARGGLQFM LIIWLQGIWL PLHGYSFEKT PLWAGIYLIP VTVGFLVAGP 
LAGRFADRYG ARPFATLGLV ITAVAFLLFD AIPIDFDYPW FALILLLMGL SMGLFAGPNT 
SSVMNTLPPN QRGAGAGMLN TFQNSASVLS IGVFFTIIAL GLAASLPDAM YSGLVGQGVS 
PAKAHELANL PPIGSLFAAF LGYNPTERLL GPDTLSQLDP AKADFLTGHT FFPNLISGPF 
GDGLRLAFAF AAVACLVAAG FSWLRGKQRP HVRRPLLEET AEGLAGAGDI AAMEDGAGSA 
LSSSPLAAER