Gene Franean1_3461 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3461
Symbol
ID	5671832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4090918
End bp	4092078
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	76%
IMG OID	641242349
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001507769
Protein GI	158315261
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.414983
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATCG ACACCGCGGG AGCTCCCAGC GCCCCGGGCA CCACAGGCGT ACTCGGCGCC 
GCGGGCCCGG CCGGCCCGCT GCTGACCGCG CGGGACGTCA CCACCACGCT GCCGGTGCCG 
GCCGGCCGGC TGCGTGCCGT CGACGGGGTC TCCTTCGCGC TCGCCCCCGG TGAGGCCCTC 
GGCATCGTGG GCGAGTCCGG GTCGGGCAAG TCGATGCTGG CCCGCACGCT GATGGGCCTG 
GCCCCGCCGA CCGCCCGCAC AACCGGCTCG GTGTGGTTCG CCGGCCGCGA CCTGCTCACC 
GCCGGCCCCG AGGAACTGCG GGAGGTGCTC GGCTCCGGCA TCGCGATGGT GTTCCAGGAC 
TCGGCGACGT CCCTGAACCC CGTGACTCGG GTCGGGTGGC AGCTCACCGA GACGCTGCGG 
CTGCGCCGTG GAATGGACCG CCGTCCCGCG CGCGAGGAGG CCGTCGATCT GCTCCGCCGG 
GTCGGCATAC CCGACCCCGA ACGGCGCGCC CGCAGCTACC CGCACGAGCT GTCCGGCGGG 
ATGCGCCAGC GGGCCTGCAT CGCGCTCGCC ATCGCCTGCG GACCGCGGGT GCTGCTGGCC 
GACGAGCCGA CCACCGCCCT GGACGTCACC GTCCAGCGCC AGATCCTCGA TCTGCTCGCC 
AGCCTGCGGC GCGGTGCGGG CATGGGGCTG GTCCTCATCA CCCACGACCT CGCGCTCGTG 
GCCGGTCGGA CCGAACGGCT CCTGGTGATG TACGCGGGAC GGGTCGTGGA GACCGGGCCT 
ACGCGGGCGG TCATCCGTGC GCCGCACCAC CCCTACACCG CCGCGCTGCT CGCCTCGATC 
CCCCGCCTGG ACCAGCCGGG CCACAGCCGG CTGGCCACGA TCCCCGGCCG GCCCGCCGCG 
GCACTGGACC CTCGCCCCGG CTGCCGGTTC GCGCCGCGAT GCCCCCGGGC ACAGCCGCGC 
TGCCGGCGGG AGGACCCCGT CCTCGGGCCC GTCACCGATC CCGGCATCGC TGCCACCGCC 
ACCGCCCCCG GTATCGCTGC CGCCGGCATC GCTGCCGGGA TCGGGACCGT CGCGAGGCCC 
GGCGAGCACC ACACGGTCGC CTGCTTCCAT CCCCACGACA GCCCGCCGCC CGGCCCGGAC 
GTCCCGCAGG AGCCACGTTG A

Protein sequence

MTIDTAGAPS APGTTGVLGA AGPAGPLLTA RDVTTTLPVP AGRLRAVDGV SFALAPGEAL 
GIVGESGSGK SMLARTLMGL APPTARTTGS VWFAGRDLLT AGPEELREVL GSGIAMVFQD 
SATSLNPVTR VGWQLTETLR LRRGMDRRPA REEAVDLLRR VGIPDPERRA RSYPHELSGG 
MRQRACIALA IACGPRVLLA DEPTTALDVT VQRQILDLLA SLRRGAGMGL VLITHDLALV 
AGRTERLLVM YAGRVVETGP TRAVIRAPHH PYTAALLASI PRLDQPGHSR LATIPGRPAA 
ALDPRPGCRF APRCPRAQPR CRREDPVLGP VTDPGIAATA TAPGIAAAGI AAGIGTVARP 
GEHHTVACFH PHDSPPPGPD VPQEPR