Gene Franean1_5843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5843
Symbol
ID	5674166
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	7088595
End bp	7089779
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	74%
IMG OID	641244693
Product	putative integral membrane protein
Protein accession	YP_001510095
Protein GI	158317587
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00448187
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.436736
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGACG GAGCCGGTCA GACCCCTCCC GGCACGCCCG GACCGGAACA GCCCGGCTCG 
TGGGGTGCGC CCTCCCCGGG CCCGCAGCAC CCACCCCCCG GTTCGTGGGA TCAGCCACCA 
CCCGGCCCCG GAAGCGGCGC GCCCACGCCC GGCGAATGGC CTGCGCCCGG CGGCTGGCAG 
GCCCCCGGCA GCGACCCCTC CGCGGCGCCG GTCCCCGGAC AGGGCGCTCC CCCCGGCTAC 
GTCCCGAACA GCCCGAACAG CGGGTACGGG CCGGGCGGGT ACGGGCCGCA CGGTGGCTAC 
GGCCAGCAAC CCGGCCCGGC CCGGGGCTAC GGCGCGTGGG GCCCGAACGG GTGGGGCGGT 
CCGCCGATCG CACCCAAGCC CGGCGTGATC CCGCTGCGCC CGCTGGCGGT CGGCGAGATC 
CTCGACGGGA CCTTCGCGAC GATCCGGTCG AACCCCGGCG CCACCCTCGG CCTTACCCTC 
GGCGCCACCG CCGTGGTCGA GACGATCAGC ACGGTCGCCG CGATCGCCGC CGAGGAGATG 
TCCAATACGG CGGCAACGGT ACTGACGCTG CTGCTCTTCG GCCTGAACGC GGCGCTCGGG 
ATCTTCCTCT CCGGGGTGCT CGCGGTGGTG GTGAGCGAGG CGACGCTCGG CGGGCGGATC 
ACCGCGGGCG ACGCCGTCCG CCGGGTCACC CCCCGGCTGG GCGGTCTGCT GATGCTGACC 
CTGGCGGTCA CGCTGTTGAG CGCGCTCGGC CTGGTCGCGC TGATCGTGGG GGCGGTCGTG 
GTCGCCGTCT ACCTGAGTCT GGCCACACCG GCCTACGTGC TCGAGGCGCA GTCGACCGGC 
GACGCGCTTC GGCGCTCGTG GCGGCTGGTC AAGGGATCGT GGTGGCGGAC GCTCGGCGTT 
CTCCTCCTCT CCGCGGCGGT CGGCGGGGTC CTGATGTTGA TCTTCGCGAT CCCGACCAGC 
GTGATCCTCA TGTCGTCCGA GCAGACGTTC GGCAGCCTGG TCGAGGGAGA CCTGACCGTG 
GCCGGGCACA TCGTCAACGC GATCGGCAGC CTGCTCGCCA CGACGGTCGC GACTCCGGTG 
CTCTCCGGGG CCGTCGTCCT CCTCTACATC GATCGGCGCA TCCGCCGCGA GGGGCTGGAC 
GTCACCCTCA CCGAGGCGGC CCGCCAACGC GCGGCCACTC CGTGA

Protein sequence

MTDGAGQTPP GTPGPEQPGS WGAPSPGPQH PPPGSWDQPP PGPGSGAPTP GEWPAPGGWQ 
APGSDPSAAP VPGQGAPPGY VPNSPNSGYG PGGYGPHGGY GQQPGPARGY GAWGPNGWGG 
PPIAPKPGVI PLRPLAVGEI LDGTFATIRS NPGATLGLTL GATAVVETIS TVAAIAAEEM 
SNTAATVLTL LLFGLNAALG IFLSGVLAVV VSEATLGGRI TAGDAVRRVT PRLGGLLMLT 
LAVTLLSALG LVALIVGAVV VAVYLSLATP AYVLEAQSTG DALRRSWRLV KGSWWRTLGV 
LLLSAAVGGV LMLIFAIPTS VILMSSEQTF GSLVEGDLTV AGHIVNAIGS LLATTVATPV 
LSGAVVLLYI DRRIRREGLD VTLTEAARQR AATP