Gene Franean1_1952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1952
Symbol
ID	5670353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2347551
End bp	2348879
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	74%
IMG OID	641240873
Product	hypothetical protein
Protein accession	YP_001506295
Protein GI	158313787
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.780394
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.542159
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACCC GACCGACTCC CGCCGGGCGC GAGCGAGAGG CCGGCCGGGT CGACCGGACC 
GGCCCGCCCC AGCGGGTCCC GGTCCGCCGG GCGCCCCGGC TCCGCCCACT GCGGCGGATC 
GCCGCCGTCG CCTCCGGGCT GGGCGTGGCC GGGTCGATCC TGCTCACCGG GTGCGTCGCC 
AGTAGTACCG ACGAGACGTC CGGAGCCCGC GCCACGTGCG CGCCGACGCC GGGTGTCACC 
CCCGACGAGG TCCGCTTCGG GGCCCTCTAC CCGGACACCG GCTCCGGTTC GCCGCTGTCC 
CGCGCGTTCC GGGCCGGCAT CGACGCCAGG CTCGGGGTCG TCAACGGTGC CGGCGGCATC 
CAGGGGCGGC AGGTGCGGTA CGACTGGCGC GACGACGAGT CGACGTCCGA CGGCGCACTG 
CGCGGCGCCC GCCTGCTCGT CGACCGTGAC CAGGTCTTCG CGATCGTCGG CACCAGCGGC 
ATCGCGACCG AGGCGGTGAG CTACCTCGCC GAGCGCGGCG TGCCGACCAT CGGCCAGGAT 
CTGACCGCCA GCGGCGACAA CGCCTTCGGC TACTCCAACG TTCTCGGCGG CCAGCTCGGG 
AACTCGGTCT TCGGAGTGTT CGCCCGTGCG CACGGCGCCA CCCGGGCCGT CCTGCTGCGG 
ACCGAGCAGA TCCCCGCCTC GGGGCAGATC GACGAGCGGA TCGCCCACAG CCTGCGCGCA 
GGCTCGGTCG AGGTCGTCGA CACCATCGAC TGGACGCCGA CCGGCTTCGA CCTGAACGCC 
GTCGCGGCCC GGGTCCGCGC GGCCAACGCC GACATGATCA CCGGAGTGGT GCCCCCGCAG 
GCGCTCGCGG ACGTCGCGAC CGCCGCCCGG CAGGCCGGGG CGACCATCAA GGTCGTGATG 
GTGCCGATCG GGTACGACCC CGGCCTGCTC GATCGCCGTC CACAGGGCCT GGCCGGCAGC 
TTCTTCCTCG TCGACTTCGT GCCCTTCGAG GCGGGGACCC CGGCGCACGA GCGCTACCTC 
GACGCGATGT CCCGCTACGC CCCCCAGATC GAGCGCCGGG AGCAGACCAC CGGTCTGGTC 
GGCTGGATGA CCGCCGACCT CTTCCTCCGG GGCCTCGTCG AGGCCGGTCC GTGCCCCACC 
CGCGCGGGCT ACATCGCCGC GCTGCGCAAG GTGGCGGACT ACGACGCGGA CGGGCTGCTG 
CCCAGGCCTG TGGACCTCGC GGTGAAGTCC GCGCCCACCG CCTGCGTGAG CGTGGTCCGA 
GTGTCCCCGG CCGCGGACGC TTTCCAGGTC CAGATGCCCA TGGCCCTCTG CGGCGAGGCG 
CTGAGCTGA

Protein sequence

MTTRPTPAGR EREAGRVDRT GPPQRVPVRR APRLRPLRRI AAVASGLGVA GSILLTGCVA 
SSTDETSGAR ATCAPTPGVT PDEVRFGALY PDTGSGSPLS RAFRAGIDAR LGVVNGAGGI 
QGRQVRYDWR DDESTSDGAL RGARLLVDRD QVFAIVGTSG IATEAVSYLA ERGVPTIGQD 
LTASGDNAFG YSNVLGGQLG NSVFGVFARA HGATRAVLLR TEQIPASGQI DERIAHSLRA 
GSVEVVDTID WTPTGFDLNA VAARVRAANA DMITGVVPPQ ALADVATAAR QAGATIKVVM 
VPIGYDPGLL DRRPQGLAGS FFLVDFVPFE AGTPAHERYL DAMSRYAPQI ERREQTTGLV 
GWMTADLFLR GLVEAGPCPT RAGYIAALRK VADYDADGLL PRPVDLAVKS APTACVSVVR 
VSPAADAFQV QMPMALCGEA LS