Gene Franean1_3049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3049
Symbol
ID	5671428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3584655
End bp	3586379
Gene Length	1725 bp
Protein Length	574 aa
Translation table	11
GC content	69%
IMG OID	641241947
Product	ABC transporter related
Protein accession	YP_001507367
Protein GI	158314859
COG category	[V] Defense mechanisms
COG ID	[COG1132] ABC-type multidrug transport system, ATPase and permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.511073
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGACAG AGCACGCGCT GCCGGTCGCG GGCGGACGTG AGACCGCTCG GGAGGTGTGG 
CGGCTCAGCC GTGGGCATCG ACGCAGTCTG GCCGCCCTCG TGGTGCTGGG AATCGCAAGC 
ACCGCCATCG ACCTGATCGG ACCCGTCGCG ATCGGGTTCC TCATCGATCG GGTCCAGGAA 
GGCGCCGCCG ACCTCGGTAC CGTGCTGACC GCCATCGCGA TCATGGCGGT CTCGGCCATT 
CTCGGTGCCG CTGGCACGGC GGCGACGATC GTCCTGGCTA CTCGCATGTA CCACACCGTC 
CTCGCCGGGC TGCGGGAGGA GCTGGTCTCC CGTGCCCTGA CGCTGCCGCA GCATGTCGTC 
GAGTCTGCCG GCACCGGGGA TCTGATCTCG CGGTCCAGCG ACGACGTCAC CGCGGTTGCC 
GATGCGGCTC CCGCGGTGAT CCCGGCGCTT ACCGTTACGT CCTTCACCAT CGTCATGTCG 
CTGGGCGGGC TGGCCGCGGT GGAATGGCCC TACGCCGCCG CCCTTGCCGT CGTGCTGCCT 
GTCTACGTGC TCTCCATGCG GTGGTACCTG CGAACAGGCC CGCGGGTATA CCTGGCCGAG 
CGTGCAGCGA TGAGCGCGCG TGCTCAGCAG ATTCTGGAGT CGCAGCGCGG CTACGCCACT 
GTGCTCGGAT TCAGGCTTGC CGAGCAGCGG CACCGCGCCG TGACCACCAC CTCCTGGGGC 
GTATCGGTGC AGGCGTTGCG GGCGCGCACC GTGCAGAGCA TGCTCAACAC CCGCCTGAAC 
CTCGGCGAGT GCCTGAGCCT GGCCGCCGTG CTCGTCGTCG GCTTCGTCCT CATCGACCAC 
GGAGCCTCGA CTGTCGGGGG CGCGACCACC GCCATGCTGC TCGTGCTACG CCTGCTGAAC 
CCGGTCAATC AGCTGCTGTT CGTCATCGAC ACTCTCCAGT CCGCCCTCGC GTCGCTGAAC 
CGCATGGTCG GAGTCACCAC CATCCCCGTC GCGGACGCGC CAGGCATCGC AACGAGCAGC 
AGCGTCCACC TCCGCGAGGT CTCCTTCCAC TACGGGATCG GCCCCCGTGT GCTCGTCGAT 
GTCACGCTCG ACATCCCCAC CGGTCAGCGT GTCGCCGTCG TAGGTTCGTC GGGTGCCGGC 
AAGTCCACGC TGGCCACGGT GGTCGCCGGC ATTCACCAGC CCGACGCCGG GACCGTGGCC 
CGACCGGAGC GCACGGTGAT GATCACCCAG GAAGTACACG TGTTCGCGGG GACATTGCGA 
GACAACCTCA CCCTCGCCGC ACCGGATGCC ACCGACGGTC AGGTAGGGGC TGCGCTGGAA 
GTGGCCCAGG CTGTAGGGAT GCTCGACCTG CTGCCCGATG GCCTTGACAC GGTGCTCGGT 
GGTGGCGGGT ACGAGCTGAC CGCCGCACAG GCACAACAGG TGGCGCTCAC TCGCCTGGTG 
CTGGCCGACC CGGAACTGGC GATCTTCGAC GAGGCCACCG CCGAGGCAGG TTCCGCGTAC 
GCCGGACTGC TCGACCGCGC CGCCGACGCT GCGCTGACCG GACGCACTGG ACTGGTGATC 
GCGCACCGGC TCTCGCAAGC CGCCGCCTGC GATCTGGTCG TGGTGATGGA GCACGGCCGT 
ATCGCCGAGC GAGGAACCCA TACAGAGCTG ATCGCCGCCG ACGGGGTGTA TGCCGCGCTT 
TGGTCGGCAT GGCGGGCCGG GCAGGAAGCT GGAGCGAATG GGTAG

Protein sequence

MTTEHALPVA GGRETAREVW RLSRGHRRSL AALVVLGIAS TAIDLIGPVA IGFLIDRVQE 
GAADLGTVLT AIAIMAVSAI LGAAGTAATI VLATRMYHTV LAGLREELVS RALTLPQHVV 
ESAGTGDLIS RSSDDVTAVA DAAPAVIPAL TVTSFTIVMS LGGLAAVEWP YAAALAVVLP 
VYVLSMRWYL RTGPRVYLAE RAAMSARAQQ ILESQRGYAT VLGFRLAEQR HRAVTTTSWG 
VSVQALRART VQSMLNTRLN LGECLSLAAV LVVGFVLIDH GASTVGGATT AMLLVLRLLN 
PVNQLLFVID TLQSALASLN RMVGVTTIPV ADAPGIATSS SVHLREVSFH YGIGPRVLVD 
VTLDIPTGQR VAVVGSSGAG KSTLATVVAG IHQPDAGTVA RPERTVMITQ EVHVFAGTLR 
DNLTLAAPDA TDGQVGAALE VAQAVGMLDL LPDGLDTVLG GGGYELTAAQ AQQVALTRLV 
LADPELAIFD EATAEAGSAY AGLLDRAADA ALTGRTGLVI AHRLSQAAAC DLVVVMEHGR 
IAERGTHTEL IAADGVYAAL WSAWRAGQEA GANG