Gene Franean1_2039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2039
Symbol
ID	5670440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2451468
End bp	2452904
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	75%
IMG OID	641240961
Product	inner-membrane translocator
Protein accession	YP_001506382
Protein GI	158313874
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4177] ABC-type branched-chain amino acid transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.898737
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.603844
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCGGC CGTGGGCGGC CCGGTCGGGG GGTGTGCCCT GGCTGGTTGT GGCCAGGTCG 
CCGGCGGCCC GGCGGCTGGG TGCCTGCCTG TTCCTGGCCG TGATCGCCGC GGTGGTGACG 
GGCCCGTCCG GGGACGCCGA CCGCCCACTG GCGGGGATCG AAGGCTCGCT CACGCCCGCA 
CGGGCGGCCG GGTTCGCTGC CGGGGGACTC GCGCTGTGGG CGCTGTCGAT CGGTGCCGAC 
CGGCTGACGA CCCGGCTCCG GTCCGCCGGC CACGGCGCCG CGCTGGGCGG CGGTCGCCTG 
GCCGCGCTGG GCGGCGGGCT GTGGGTGGCG CCGGCCGGTG CCGCGTGGGC GTCGTTCCGC 
CGGGGCCGGT GGGCGGCGCC GGCGGGCAAC CTGGCGCTGC TCGCCGTCGC CGTGGCGGTC 
CCGCCGCTGC TGTCCACGGC GGCCCAGCAG GCGCTGGTGA GCGAGATCGG GATCTACGCC 
CTGCTCGCCC TCGGCCTGAA CGTCGTCGTC GGCTACGCCG GACTGCTCGA TCTCGGCTAC 
ATCGCCTTCT TCGCGATCGG CGCCTACACC ACGGCCTACG TGACGTCCGC GGACGCGATG 
CCCTGGCACG CGCCCTGGCA GGTCAACCCG TTCTTCGCGC TACCCGTCGC ACTGGTCGTG 
GCCGCCGTCG CGGGTGTCGT CCTGGGCGGC CCCACGCTGC GCCTGCGCGG GGACTACCTG 
GCCATCGTCA CCCTCGGGTT CGGCGAGATC GTCCAGTTGC TCGCGAACAA CGCCGACGGC 
GTCACCGGCG GCCCACGCGG CGTGTTCGGC CTGCCGCCGC TGTCGGTCGA CCTGCCGGGT 
GTGCACTACT CCTGGGGCCT GAGGCCGTTG CCCTACTACT ACCTACTCGT CGTCCTGATC 
GTGCTCGTCA TGGTGGTCTT CGGCCGGTGG GAGCGCTCCC GGACCGGCCG GGCCTGGACG 
GCGATCCGCC AGGACGAGGT GGCCGCCGAG GCCACGGGCG TGGCGACGAT GCGGATGAAG 
CTGCTGGCCT TCGCCGTCGG CGCGTCCGTG TCGGGCTTCG CCGGCGTGGT CCTGGCGACC 
AAGCAGTTCT TCAACCCGCA GACGTTCGGC CTGCAGTCCT CCCTCCTCGT GCTGACCATC 
GTGATCTTCG GTGGTATGGG CTCGCGGCTC GGCGTGGTGC TCGGGGCGCT GGTCCTGCAG 
GGGACGGCCT TCCTCCTGCG CGACACGGTC CCGCCCGCGG ACCGCTACAT CTACTTCGGC 
GCAGTGGTGA TCCTGATGAT GATCTTCCGT CCGCAGGGCC TGCTGCCGCC GCGGGGCCCG 
CGGGCACCCG TCAGCCCCGG CCCGGCCGCC GCCCCGGAGC ACCCGGCGGT TCTCACCGAG 
CGCGCCGGAG CCTCGGGACC AGCCGGGCCC GCAGCGTCGG CCGAGGCGGC GCGGTGA

Protein sequence

MARPWAARSG GVPWLVVARS PAARRLGACL FLAVIAAVVT GPSGDADRPL AGIEGSLTPA 
RAAGFAAGGL ALWALSIGAD RLTTRLRSAG HGAALGGGRL AALGGGLWVA PAGAAWASFR 
RGRWAAPAGN LALLAVAVAV PPLLSTAAQQ ALVSEIGIYA LLALGLNVVV GYAGLLDLGY 
IAFFAIGAYT TAYVTSADAM PWHAPWQVNP FFALPVALVV AAVAGVVLGG PTLRLRGDYL 
AIVTLGFGEI VQLLANNADG VTGGPRGVFG LPPLSVDLPG VHYSWGLRPL PYYYLLVVLI 
VLVMVVFGRW ERSRTGRAWT AIRQDEVAAE ATGVATMRMK LLAFAVGASV SGFAGVVLAT 
KQFFNPQTFG LQSSLLVLTI VIFGGMGSRL GVVLGALVLQ GTAFLLRDTV PPADRYIYFG 
AVVILMMIFR PQGLLPPRGP RAPVSPGPAA APEHPAVLTE RAGASGPAGP AASAEAAR