Gene Francci3_0465 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0465
Symbol
ID	3903196
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	543934
End bp	545091
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	74%
IMG OID	637877796
Product	ABC transporter related
Protein accession	YP_479580
Protein GI	86739180
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.365708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.194401
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGGA TCACGGAACC GGCCGACGGA CCCGCCGTGG TGACGGCCGC CACCGCGGGG 
GTGCCGATCG AGATCGACGG GCTGGGCCGG TCGTTCGGCC CGGTCCATGC GCTGCGCGAC 
GTCACGCTGA CGGTTGCGCC GGGGGAGATC GTCGCGCTGC TCGGACCGTC CGGCTCGGGC 
AAGTCGACGC TGCTGCGGAT CTGCGCCGGG CTCGAGGAGC CGACGTCGGG TGATCTGCGT 
TTCGGCGCGG TCAGCCAGCT TGGCGTCGCA CCCCACCGCC GGGACGTGTC CATGGTCTTC 
CAGCATTTCG CGCTCTACCC GCATCTGACG GCGCTGGAGA ACCTCACTCT GGCGTTGCGT 
CACGGCCGCG GCCTGCCGAA GGCCGCGGCG GTGGCCCGGG CCCGTGAGAC GCTGGACATG 
CTCGGCATCG GTGAGCTGGC AGCTCGCCGG CCCGCGAAGA TGTCCGGGGG CCAGCGCCAG 
CGGGTCGCGA TCGGCCGGGC ACTCGCGACC CGGGCCCGGG TGATCCTGTT GGACGAGCCG 
ATGTCGGGGC TCGACGCCCA GCTCCGGGTC GATCTGCGGG TCGAGATCGT GGGCCTGCTG 
CGCCGGCTCG GCACCACCGC CCTGTTCGTC ACGCACGACC AGGCCGAGGC GATGGCGGTC 
GGTGACCGGG TCGCGGTGCT CAGCGGCGGC CGGCTGCAGC AGATCGGGAC GCCCGACGAG 
ATCTACGACC GGCCCGCCAC GCGCTTCGTC GCGGCGTTCA TCGGCAGCCC GCCGATGAAC 
GTCCGGGAGG GACGCTGGCA TGACGGCCAA CTGCACGGGG ACGGATTCGC CCTGCCCGCC 
CCCGCCGGCG CGACGGCATT CGGAGTCCGG CCCGAGCACC TGGTCCTGGT GGCGGCGGCT 
TCCACTGGAT CGGGATCGGT ACCGGCGGAC GCCGTGGTGG CGCCGGTGGC GCTGGCGTCG 
GACGCGCTGC GGGTAACCGG TGAGGTCGTG GTGAGCGAGC GGCTCGGGGC GGAGCGGACG 
GTGTACGTCC GGACCTCCGC CGGGGTGCTC GCCGTCAGGG TCGACGCCGC TGAGGTGCCC 
GGCGTGGGCA TGCGGGTCAC CCTGCGCGCA CCGCTGTCCA CCCTGACCTT CTTCGACGCC 
GCCGGCGCCC GGATCTGA

Protein sequence

MTRITEPADG PAVVTAATAG VPIEIDGLGR SFGPVHALRD VTLTVAPGEI VALLGPSGSG 
KSTLLRICAG LEEPTSGDLR FGAVSQLGVA PHRRDVSMVF QHFALYPHLT ALENLTLALR 
HGRGLPKAAA VARARETLDM LGIGELAARR PAKMSGGQRQ RVAIGRALAT RARVILLDEP 
MSGLDAQLRV DLRVEIVGLL RRLGTTALFV THDQAEAMAV GDRVAVLSGG RLQQIGTPDE 
IYDRPATRFV AAFIGSPPMN VREGRWHDGQ LHGDGFALPA PAGATAFGVR PEHLVLVAAA 
STGSGSVPAD AVVAPVALAS DALRVTGEVV VSERLGAERT VYVRTSAGVL AVRVDAAEVP 
GVGMRVTLRA PLSTLTFFDA AGARI