Gene Franean1_1285 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1285
Symbol
ID	5669698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1550818
End bp	1552065
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	72%
IMG OID	641240217
Product	hypothetical protein
Protein accession	YP_001505645
Protein GI	158313137
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.193911
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.90193
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGACGAC GTCTGGGTCT GCGGCTCGGG GCCGCCTTCG CCGGGGCCGC GCTGGCGCTC 
GCCGCGTGCG GCGGCGGCGA CGGCGAGCAG GGCGGTGGCA CGGCCACCAG CTCCGGCGCC 
CCGGTCAAGC TGATGATCAT CGCGCCGGTC GGCACCACCG GGGCCAACCA TCCCGAGATG 
GTGGCGGCGG TCCGGGCCGC CGCCCGCGGT GTCAACGAGC GTGGCGGCAT CAAGGGCCAT 
CCGGTCGAGA TCCTGCACTG CAACGAGAAG AACGACCCCA CCGCGGCGAA GGAATGCGCC 
CAGAAGGCGG TGGACGAGCA CGTTCTGGCC GTGGTCTCCA CCGTCAACGG CTCGGGCGGG 
ATCATGCCGA TCCTCGAGGA GGCCGGCATC CCGGCGATCG GGTCGGCCGG GATCGCGGCG 
GACGGCTCCG AGCTCAGCTC GGACGTCAGC TTCGTCGTCA GCCCGCTCAC CTTCTACCCG 
GCCGTCTGCC CGTCGCTGCT ACGCAAGGCC GGGGCGTCCA AGATCGGGCT GGTCGGCTAC 
GACCTGAGCG CGAGTGACCG CCTGATCACG ATGGCCCAGG CCGGCGGGCG CGCGGCCGGG 
GCGCCGATCA ACCCCGAGTT GCGCATCCCG ATCACCAGCA GCGACCTCAC CCCGACCGTC 
GCACAGCTGA GCAGGGCGGG TGCGGACGGC GCCGTCCTGG TGGTGTTCGA CCAGGCCGCC 
TACGCGGTCA TCGGCGGCGG CGACCCGAAC CTGCGCACCT GCCACGCGGC CGGCACCCTC 
TCCAAGGAGT ACCTCGCCAC GCTCGGGCCG GCCGCCGACA ACCTCGTCGT CGCCAGCGCG 
TTCCCCGAGC TCAGCCAGGC CGCCGAGTTC CCCGAACTCA AGCGGATGAT CTCCGAAATG 
GACGCCGAGG CGGCTGGGGG CGACGCCGAC GCGCGCGCCG ACCTCCGGGA TTCCACGGAG 
ACCACCGGGG CGTGGCTGTC CGTCCAGATC GCCGAGAAGG TCGGCAACTC CGTCTCGGGC 
GACCTGACGA CGAAGAGCCT GCTCGAGCAG CTCCGCGCGA CCAAGGGCCT CGACCTCGGC 
GTGATCCCGC CGCTGGACTT CACCACACCC AACCCCATCC CGGGCGTGGA GCGCGTCTTC 
AACACGACGA TGCGCGGTGC CCGCTGGAAC AGCGCCCAGC ACACCTTCGT CCCGCTCGGG 
CCGGAGACCT ACGAGGCGCT CGGCCTGCTG ACCCGCGGCG CTTCCTGA

Protein sequence

MRRRLGLRLG AAFAGAALAL AACGGGDGEQ GGGTATSSGA PVKLMIIAPV GTTGANHPEM 
VAAVRAAARG VNERGGIKGH PVEILHCNEK NDPTAAKECA QKAVDEHVLA VVSTVNGSGG 
IMPILEEAGI PAIGSAGIAA DGSELSSDVS FVVSPLTFYP AVCPSLLRKA GASKIGLVGY 
DLSASDRLIT MAQAGGRAAG APINPELRIP ITSSDLTPTV AQLSRAGADG AVLVVFDQAA 
YAVIGGGDPN LRTCHAAGTL SKEYLATLGP AADNLVVASA FPELSQAAEF PELKRMISEM 
DAEAAGGDAD ARADLRDSTE TTGAWLSVQI AEKVGNSVSG DLTTKSLLEQ LRATKGLDLG 
VIPPLDFTTP NPIPGVERVF NTTMRGARWN SAQHTFVPLG PETYEALGLL TRGAS