Gene Franean1_4067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4067
Symbol
ID	5672425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4847551
End bp	4849362
Gene Length	1812 bp
Protein Length	603 aa
Translation table	11
GC content	75%
IMG OID	641242943
Product	ABC transporter related
Protein accession	YP_001508360
Protein GI	158315852
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCAA CAGCTCTGTC CGCCCATGAC CTTGTCCGCG TGCTCGGTGG GCGCAGGGTT 
CTCGACGGCG TCTCCCTCAC GGCCGTTCCC GGTCAGCGGA TCGGACTGAT CGGGGAGAAC 
GGCGCCGGCA AGTCCACGCT GCTGCGCCTG TTGGCCGGGA TGGACGAGCC GGACGGCGGC 
TCCGTCGTCC GGCCCGCGGA GCTGGGGTTC CTCCACCAGG AGATGCCCTT CGACCCCGCC 
GCGACCATCC GTCACGTGCT CGACGACGCC CTGCGCGAAG CCCGCGCGGA TCTCGCCGAG 
CTCGACCGGC TGACCAGCGC GCTCGCCGCC GGCGACTCCG CCCCTGGTGG CCCGGCCGAC 
GGCGAGTCGA CCGACAGCGG CACGGCCCAG GCCGACCTGC TCGCCGCGTA CTCCGCGTGT 
CTCGAACGGG TCGAGGAGCA TGCGGCCTGG GATGCGGACC GGCATGCCGA GATGGTCCTT 
GCCGGCCTCG GTCTCGCACG GGTTCCGGCC GACCGCGCGC TCGGCTCGCT CTCGGGCGGG 
CAGCGCGGCC GGCTCGCGCT CGGTGCGCTG CTGGTTCGCC GCCCCGCCGC GGTGCTGCTG 
GACGAGCCCA CAAACCATCT TGACGATGAC GCTGCGGTGT TCCTGGAGGA GCAGCTGCGG 
GCTCTGCCCG GAGTCGTGAT CGCGGCGAGC CATGACCGGA CTTTCCTGGA CGCGGTGTGC 
ACCGACCTGA TCGATCTCGA TCCCGCGCTG GGCGGCCCGA CCCGCTACGG GGGTGCCTAC 
ACCGAGTACC AGCAGGCGCG GCGCCTGGAG CGGGAACGCT GGGAGCGCCG GTTCGCCGAG 
GAGCAGGAGG AGCTGGCGGC GCTGCGGCAC GCGGTCGCGG TGACGGCCCG CCAGGTCGCG 
CACAACCGCC CGCGTCGCGA CAACGAGAAG ATGAACTACG GCCGCACCGC CGGCCGGGTG 
CAGGACCAGG TGTCGCGGCG CGTGCGCAAC GCCGCCCGCC GGCTCGGTGA CCTGGAGCGG 
GAGCAGGTCC GGCGGCCACC GCGGCCGCTG CGGTTCCGGG TCGGCGCGCT CGTCGCCGAG 
CCGTCCGCCT CTCCGTCCGC TGCCCTGTCG TCGGCGGGCG TCCCGGCCCA GGCGGGTCCG 
GGGCAGGGGA CCATCGTCTC GTTGCGGGGG GTGCGTGTTC CCGGCCGCCT CGTCCTCGAC 
CGTCTCGACG TGACGGTGAC GGACCGCCTG CTGCTCACCG GTCCCAACGG CGCGGGCAAG 
TCGACGCTGC TGGCGGTCCT GGCAGGCCGC CTCGAGCAGG CCGGCCCCGC GCTCACTCCG 
TCCGAGCCGA CACTCGATGG CGTTCCCGGC GTTCCCGGCG TTCCCGGCGT TCCCGGCGTT 
CCCGGCGTTC CCGGCGTGAC GGGGGAGGTG CTGCGGCGGC GTGGGCTGCG GGTCGGCCTG 
CTGGCGCAGG ACACGGTCTT CGCCCGGCCG GACCGCACCG CGCGGGACGT CTACACGCTC 
GCGCTGGGAC CCGAGCGGGC CGCGGCGGTG CCGCTGGCCT CGCTCGGCCT GCTGGCCCCA 
CGCGACCTCG GTACGCGGGT GGGGGAGCTG TCGGTCGGGC AGCGGCGCAG GCTCGCGCTG 
GCGCTGCTGG TGGCGGAGCC ACCCGAGCTG CTGCTGCTCG ACGAGCCCAC CAACCATCTC 
TCGCCGGCGC TCGCCGACGA GCTGGAGGAG GCGCTGGGCG GCGGCCCGGG CGCCATCGTG 
GTCGCCAGTC ACGACCGCTG GCTGCGCTCC CGGTGGCCCG GCCGCGAGCT GAGGCTGACC 
CCGGCCGGGT GA

Protein sequence

MPATALSAHD LVRVLGGRRV LDGVSLTAVP GQRIGLIGEN GAGKSTLLRL LAGMDEPDGG 
SVVRPAELGF LHQEMPFDPA ATIRHVLDDA LREARADLAE LDRLTSALAA GDSAPGGPAD 
GESTDSGTAQ ADLLAAYSAC LERVEEHAAW DADRHAEMVL AGLGLARVPA DRALGSLSGG 
QRGRLALGAL LVRRPAAVLL DEPTNHLDDD AAVFLEEQLR ALPGVVIAAS HDRTFLDAVC 
TDLIDLDPAL GGPTRYGGAY TEYQQARRLE RERWERRFAE EQEELAALRH AVAVTARQVA 
HNRPRRDNEK MNYGRTAGRV QDQVSRRVRN AARRLGDLER EQVRRPPRPL RFRVGALVAE 
PSASPSAALS SAGVPAQAGP GQGTIVSLRG VRVPGRLVLD RLDVTVTDRL LLTGPNGAGK 
STLLAVLAGR LEQAGPALTP SEPTLDGVPG VPGVPGVPGV PGVPGVTGEV LRRRGLRVGL 
LAQDTVFARP DRTARDVYTL ALGPERAAAV PLASLGLLAP RDLGTRVGEL SVGQRRRLAL 
ALLVAEPPEL LLLDEPTNHL SPALADELEE ALGGGPGAIV VASHDRWLRS RWPGRELRLT 
PAG