Gene Franean1_3002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3002
Symbol
ID	5671385
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3531611
End bp	3532813
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	63%
IMG OID	641241905
Product	hypothetical protein
Protein accession	YP_001507325
Protein GI	158314817
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGGCTG CTCTTCTGCT CCTCACAGGA GCCTGCTCTG CCTCGGACGT TTCACCGGCA 
CCACGTGACT GCGTCGTGTC CCCGGGAGTT ACCAAGGACA CGGTCAGGCT CGGCCTGATA 
CTGACGGACA CCGGGACTAC AGCCAAACTG TTCATCGGTG CCCGCGCTGG TATCGATGCG 
CGAATCCGGT CTCAGAACGA GAGGGGCGGG GTGCGCGGCC GCACACTCGT CTATGACTGG 
CGGGACGACG AGTCGAATCC AGCTCAGAAC CTGGCCGTTG CGAGAGAGCT GGTCGAGAAC 
GGCAAGGTCT TCGGCCTGCT CAGCGCCACA AGCGTGGCTA CTGGCTCGGC CCAGTACCTT 
CACGGCGCCA GAGTACCGGT CGCTGGCCTT GCGATGGAAT CGGTATGGTC GACCTTCGAC 
AATATGGTCA GCTACATGAA CCAGATGCCG TCGGCGGTGG CGTTCGACAC CCTCGGGCGA 
TTCAGCAGCG CTATGGGTGT CCAGCGCGCT GTCATCGTCA TGACCGGCTC CTCCGAGACG 
TCCCGGGCCG GGGCGACCTG GATCGCGAAA ATCCTGCAAT ACTCCGGAAT AGGGATCGCG 
GCAACCCTAG ACTACTCGCC GGCAGCGATC ACGCCGGCAC TGCTAGGACG GCAGATAGCA 
CAGCTCAGAG CCGACGGGCT GTTCGTCTCG ATGCCCGGCG ATGACTTCTC CGACATTTAC 
TACGGCGCGA TGACTGCTGG CGCCGCCTTC AAGGTTGGAC TCGGAGTCCA CGGCTACGGC 
CATGAGCTCC TGGCTCGGAA TGGAACGAAG ATCGGCGGTG CATACTTCTA TGTCCCATAT 
CTCCCCTTTG AGGCGAACGC ACCCGCACAG CGCGCATATC TCGATGCGGT CACGCGGTAC 
GCGCCGGAAC TCAACCCCCC CGAGGCTCAG GCGGCCGTCG AGTCCTATAT CACCACCGAC 
CTGCTGATCA GAGGGCTCGA GGCTGTGGGG CCGTGCCCTA CACGCGACGG TCTGCTCGGG 
GCACTGAGGT CGATCTCGGA CTTCGATGGC TCGGGTCTGC TGCCCGTACC CATCGATCTC 
ACGCAGGGTT TCGGTCAGCC AGGCCGCTGC CTCACCTTCG TACGCGTCAA TCAGGCGGGC 
GCGGGATTCG ATGTCATGAA GCCACCGGTG TGCGGCGAGC TCATTCCCAG TCCGACCCCG 
TGA

Protein sequence

MSAALLLLTG ACSASDVSPA PRDCVVSPGV TKDTVRLGLI LTDTGTTAKL FIGARAGIDA 
RIRSQNERGG VRGRTLVYDW RDDESNPAQN LAVARELVEN GKVFGLLSAT SVATGSAQYL 
HGARVPVAGL AMESVWSTFD NMVSYMNQMP SAVAFDTLGR FSSAMGVQRA VIVMTGSSET 
SRAGATWIAK ILQYSGIGIA ATLDYSPAAI TPALLGRQIA QLRADGLFVS MPGDDFSDIY 
YGAMTAGAAF KVGLGVHGYG HELLARNGTK IGGAYFYVPY LPFEANAPAQ RAYLDAVTRY 
APELNPPEAQ AAVESYITTD LLIRGLEAVG PCPTRDGLLG ALRSISDFDG SGLLPVPIDL 
TQGFGQPGRC LTFVRVNQAG AGFDVMKPPV CGELIPSPTP