Gene Franean1_2046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2046
Symbol
ID	5670447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2463845
End bp	2465131
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	72%
IMG OID	641240968
Product	hypothetical protein
Protein accession	YP_001506389
Protein GI	158313881
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.621675
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTTCGTT CGAAGTTGAT CGGCACGGCG CTCGTGACGG CGGCGCTGGT GAGCGCCTGT 
GGCGCAGGAG GATCCACCCA GAGCGGAACG GCGACCTGGA CCTGCGCGCC GGGTGTCACT 
GACGACGAGA TCACGGTCGG CGTCCTCTAC CCGGACAGCG GCGCAATGTC AGCCCAGTAC 
ACCGGATACC GCTCCGGTGT CGAGGCCCGC ATGGCGGAGC AGAATGCCGC CGGCGGGGTC 
GGCGGCCGCC GGATCACGAC GATCTGGCGT GATGACGAGT CCAGCCCGGG CGTCAACCTG 
CGCGCGGCGA AGGATCTCGT GACCGCGGGC GCGTTCGCGA TCCTCGAGCA CACGGCGTAC 
TCGGAACAGT CCGCGCCCTG GCTCGACCAG CAGCACATTC CAGTGGTTGG CGTGGCCGAC 
CAGCCGCTGT GGGCGGACCA CCCGAACATG TTCACGTACA CGTACGTCGC CGACGACACC 
GAGGCGACGA CCACCCTGGG GCAGTTCGTC CAGTCCCGCG GCGGAACCCG GGCGGCGCTG 
ATCATCACCT CGGCGACCCG GGCTTCCCTG CTCTACGCCG AGAGCGCGCG ACGCAGCCTG 
GCGGCGGCGG GCATCCCGGT CGTGTTCGAG GAGCCGATCG ACGGCATCAC CATGCCCGAC 
GTCGTCGGGC GGATCGTCCG GACCGGAGCG GACACCCTGG TCGCGGCCAC CTCGCTCGAC 
ATCTACATCG GCGCCCTGAT CACCGCCGCC GAGCAGGGCC ACCCCTTCGG GACGGCGGTC 
TCCCCCGCCG GCTACGACAT GCGCGTGCTG GCCTCCGGCC TGCGGCAGGC CCTGGCCGGC 
ACCTACACGC CGCTGCCCTT CACCGCGCTG GAGCGGGGCC TGCCCGCCCA CCGCGACTAC 
CTGTCCGCGA TGACCCGGCA CGCCCCCGAG ATCCAGCCGC CGAGCCAACA GAGCGCCGTC 
AACGGGTGGA TCAGTGCCGA CCTGTTCCTG CGCGGCCTGC GGACCCAGGG GCACTGCCCG 
ACCCGCGACT CCTACATCCG CGGGCTGCGC GCAGTGACCG ACTACGACGC CGGCGGCCTG 
CTCACCCAGA AGATCAACTT CTCGGCCGGG CAGGGCCAGC TGGACCGCTG CGCCGACTTC 
GTCCGCGTCT CCGCGACCGG TGACGTGTTC GAGGTCGTCG AGCCGCAGCC GCGATGCGGC 
GAGCTCGTCC CGGCGGCTCC GGCCGTCACC GCGGCGACGG CCGCGGCACA GGACGGCGCA 
GGCCGGTCTG GACATCTGCT CACGTAG

Protein sequence

MFRSKLIGTA LVTAALVSAC GAGGSTQSGT ATWTCAPGVT DDEITVGVLY PDSGAMSAQY 
TGYRSGVEAR MAEQNAAGGV GGRRITTIWR DDESSPGVNL RAAKDLVTAG AFAILEHTAY 
SEQSAPWLDQ QHIPVVGVAD QPLWADHPNM FTYTYVADDT EATTTLGQFV QSRGGTRAAL 
IITSATRASL LYAESARRSL AAAGIPVVFE EPIDGITMPD VVGRIVRTGA DTLVAATSLD 
IYIGALITAA EQGHPFGTAV SPAGYDMRVL ASGLRQALAG TYTPLPFTAL ERGLPAHRDY 
LSAMTRHAPE IQPPSQQSAV NGWISADLFL RGLRTQGHCP TRDSYIRGLR AVTDYDAGGL 
LTQKINFSAG QGQLDRCADF VRVSATGDVF EVVEPQPRCG ELVPAAPAVT AATAAAQDGA 
GRSGHLLT