Gene Francci3_2020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2020
Symbol
ID	3906736
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2372728
End bp	2373807
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	72%
IMG OID	637879356
Product	daunorubicin resistance ABC transporter ATP-binding subunit
Protein accession	YP_481123
Protein GI	86740723
COG category	[V] Defense mechanisms
COG ID	[COG1131] ABC-type multidrug transport system, ATPase component
TIGRFAM ID	[TIGR01188] daunorubicin resistance ABC transporter ATP-binding subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.197661
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGCCA TGCCCGCGGT CCAGGCCGGT GGTCTGGTCA AGAGATTCGG CGATTTTCAC 
GCCGTCGACC ACATCGATCT CGAGGTGCAC CACGGCGAGA TCTTCGGCGT GCTCGGGCCC 
AACGGCGCCG GCAAGACGAC GATGCTGAAG ATGCTGGCCA CGCTGTTGGC GATCGACGAC 
GGCCGGGCCG AGATCTTCGG CGTCGACGTC GCCGCCCAGC CGCACCGGGT CCGTCAGCTC 
ATCGGCGTGA CCGGCCAGTA CGCCTCCGTG GACGAGGACC TCACCGCCAC CGAGAACCTG 
TGGCTGTTCG GCCGGCTCCA GGGCCTGCGC TCGGCTGACG CGCGCGCCAC CGCGCGCCGG 
CTGCTGGAGC AGTTCGGTCT CGAGGAGGCC GCCGAACGAC AGATCTCGGC GTTCTCCGGC 
GGGATGCGCC GCCGCCTCGA TCTTGCCGCG TCCCTCATCA CCCGGCCACC GTTGATCTTC 
CTGGACGAGC CGACGACCGG CCTCGACCCG CGTACCCGCG GCCAGATGTG GGACACCATC 
CGCGAGCTCG TCAACGACGG CTGCACCGTC CTGCTCACCA CGCAGTACCT GGACGAGGCC 
GACCAGCTCG CCGACCGGGT CTGCGTGATC GACCACGGGC GCAAGGTCGC CGAGGGCACG 
CCGGACGAGC TCAAGACCCA GGTCGGCGAC TCGACGCTGC AGCTTCAGCT CGCCCCCGGC 
GCTGACCAGG AGCGCGCCCG CGAGGTGGTG CTGCGGGTGC TCGGCGAGGA GCCGGTCACC 
ACGCCCGAGT CCGGCCGGCT CAACGTCCCG CTCGACGTCG CCGACCGGGC CGCCGACGTG 
CTGATCGCGC TGCGCGGGGC CGCCGTCGCG ATCGCCTCGG TCAGTGTCGC CAAACCGACC 
CTCGACGAGG TCTTCTTCGC CCTCACCGGC CACGGCGCCG GTCCCGGCCA CGGCGGCCCG 
GGCGACGCCG GCGACCCGGG CGACGCCGGC GACCCGCAGA CCGCCGGCGG CCCGACCGGA 
GCGGTACCCG ACCAGGACGC GACCGGCCCC GACGACCACG CCACGGAGGT AACTCGATGA

Protein sequence

MTAMPAVQAG GLVKRFGDFH AVDHIDLEVH HGEIFGVLGP NGAGKTTMLK MLATLLAIDD 
GRAEIFGVDV AAQPHRVRQL IGVTGQYASV DEDLTATENL WLFGRLQGLR SADARATARR 
LLEQFGLEEA AERQISAFSG GMRRRLDLAA SLITRPPLIF LDEPTTGLDP RTRGQMWDTI 
RELVNDGCTV LLTTQYLDEA DQLADRVCVI DHGRKVAEGT PDELKTQVGD STLQLQLAPG 
ADQERAREVV LRVLGEEPVT TPESGRLNVP LDVADRAADV LIALRGAAVA IASVSVAKPT 
LDEVFFALTG HGAGPGHGGP GDAGDPGDAG DPQTAGGPTG AVPDQDATGP DDHATEVTR