Gene Franean1_2594 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2594
Symbol
ID	5670988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	3073287
End bp	3074738
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	71%
IMG OID	641241510
Product	type II secretion system protein E
Protein accession	YP_001506930
Protein GI	158314422
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4962] Flp pilus assembly protein, ATPase CpaF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTCC CGTCCTGGCA CGACCCGCAC CGACCAGCTG CGTCCGGGAA CGGTGCGGGC 
TGGCCCGGTC CGCTCGTCCC CTGGGACGGC GCCGGCGGTG GGGGCCCGGC TGCGCCGACC 
GATCTTCCCG GCCGTGCCTC CGGCTCAGCG GCCGACGCCC TGCGCCTTCG GCTCCGTGAC 
GGACTGCGGG CCGCGCTCGC CCGTCGGCTG CGGGCGGACG AAGACGCGGG CTCCCCGCCG 
CTGACCGCGC AGGCACGCGA GGCGTTCGCC CGCTCCGTGC TCGTGGACCT GACCGAGGCC 
CACACCACCG CCGAGCTGGC CCGCGGAGCG GCGGTCCTGA CGCCCGAGGA CGAGCAGCGC 
GTCATTCACG AGGTCCTCGC CGAGGTCCTC GGGCTCGGCG GCCTCGAACC GCTCCTGGCT 
GATGCCAGCA TCGAGAACAT CAACATCAAC GGTGATCGGG TGTTCATCCG CCGGGCGGAT 
GGCAGCCGGC AGCGGCTTCC GGCGATCACC GGCTCGGATG CTGAGCTGGT CGGGCTGATC 
CGTGACCTGG CAGCACATGC CGGGGTGGAG GAGCGGCGTT GGGACCGCGG CGCCCCCATG 
GTCAATTTTC ATCTGGCCGA CAAGAGCCGC GTGTTCGCGG TCATGGCCGT CACCCAACGG 
CCTTCCGTCA GCATCCGGCG GCACCGGTTC CGCCACGTCA CCCTGTCCGC GCTGCGGGCC 
AACGGCACGA TCGACTACGG GCTGGAGGGT CTGCTCGCGG CGCTGGTGGC GGCGCGGAAG 
AACATCGTGG TCGCCGGGGG CACCGCGATC GGGAAGACTA CGATGCTGCT CGCCTTGGCC 
GACCAGATCC CACCGTCGGA GCGGTTGGTG ACGGTGGAGG ACGTCTACGA GCTCGGGCTC 
GACGCCGACG AGCGGGCTCA CCCGGATGTG GTCGCCATGC AGGTGAGGGA ACCCAACACC 
GAAGGCGAAG GCGCGATTTC TGCCTCAGAC CTGGTCCGGG CGGCGTTGCG GATGTCCCCC 
GACCGGGTGA TCGTCGGCGA GGTCCGCGGG CCCGAGGTCA TTCCGATGCT CAACGCCATG 
AGCCAGGGCA ATGACGGATC GATGACCACC CTGCACTCCT CGACTTCCCG CGGGGTGTTC 
AGCCGGCTGG CCTCCTACGC CGTACAGGGC CCGGAACGGC TGCCCGTCGA GGCGACGAAC 
CTGCTGATCG CCAGCGCGAT CCATGTCGTT GTCCATCTGG CCGAGCCGCG CGGTGAACCG 
GGCCGCCGCG TCGTCTCGTC GGTGCGAGAG GTGGTCGACG CCGACGGTGT GCAGATCGTG 
ACAAACGAGT TGTACCGGCC GGGTCCCGAC CGCCGCGGCC TGCCGGCGGC ACCGCCGACC 
GGGGAGCTGC TCGACGACCT GATCGACGTC GGTTTCGACC CGGACCTGCT TGCCCGGGGG 
TGGTGGGGAT GA

Protein sequence

MTVPSWHDPH RPAASGNGAG WPGPLVPWDG AGGGGPAAPT DLPGRASGSA ADALRLRLRD 
GLRAALARRL RADEDAGSPP LTAQAREAFA RSVLVDLTEA HTTAELARGA AVLTPEDEQR 
VIHEVLAEVL GLGGLEPLLA DASIENININ GDRVFIRRAD GSRQRLPAIT GSDAELVGLI 
RDLAAHAGVE ERRWDRGAPM VNFHLADKSR VFAVMAVTQR PSVSIRRHRF RHVTLSALRA 
NGTIDYGLEG LLAALVAARK NIVVAGGTAI GKTTMLLALA DQIPPSERLV TVEDVYELGL 
DADERAHPDV VAMQVREPNT EGEGAISASD LVRAALRMSP DRVIVGEVRG PEVIPMLNAM 
SQGNDGSMTT LHSSTSRGVF SRLASYAVQG PERLPVEATN LLIASAIHVV VHLAEPRGEP 
GRRVVSSVRE VVDADGVQIV TNELYRPGPD RRGLPAAPPT GELLDDLIDV GFDPDLLARG 
WWG