Gene Franean1_7008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_7008
Symbol
ID	5675319
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	8545929
End bp	8547110
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	68%
IMG OID	641245854
Product	hypothetical protein
Protein accession	YP_001511245
Protein GI	158318737
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2822] Predicted periplasmic lipoprotein involved in iron transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.926109
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.546103
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAATCGC CTGTCGGCCG CGTCATGCGC CTGGCCTGTC CTGTCGTCGT GGCCGCAACC 
CTTGCCGCGG CCTGCTCGTC GGATAACTCC TCCGACTCCG GCACGTCCGG CGCCAGCGGC 
GGACCGATCG CGGTGAACGC GGGTGACAAG GACTGCAAGG TGGCCAGCGC GGAACTGCCC 
GCGGGCCGGC ACACCTTCGA GGTCACCAAC TCCGCGTCGC AGGTCACCGA GGTGTACGTC 
TACGCCGACG GCGACCGGAT CATGGGCGAG GTCGAGAACG TCGGCCCGTC GACGAAGCGG 
AACCTGATCG TCGATCTGCC GGCCGGCAGG TACCAGGTGG CGTGCAAACC CGGCATGGTG 
GGCGACGGCA TCCGCACCGC GCTCACGGTT ACCGGCGAGG CCGCGCCGCC GCAGACGCTC 
GACCAGAACC TGCAGACCGC GGTCACCTCG TACAAGACGT ACGTCGGGTC CGAGACCCAG 
GCTCTGGTCG ACACCACCGC GGGGTTCGTC GAGGCGATCA ACTCGGGTGA CCTGGCCAAG 
GCCAAGGAGG CCTACCCGAA CGTCCGGCTG CACTACGAGC GCATCGAGCC GATCGCGGAG 
TCCTTCGGCG ACCTCGACCC GCTCATCGAC ATGCGCATCG ACGACGCCAC GCCCGGCACC 
CCGTTCGTCG GCTTCCACGC GATCGAACAG AAGCTGTTCG AGGGGAACAC CCTGGACGGG 
ACCCAGCCGC TCGCCACGAC GCTGACCACG AACGTCGGCA AGCTCAACGA GCTGATCAAG 
ACTGTGGAGC TCACGCCGCT GGTCATGGCC AACGGGGCGA AGTCGTTGCT CGACGAGGTC 
GCCGCGTCGA AGGTCACCGG TGAGGAGGAG CGCTACTCCC GCATCGACCT GGTCGACTTC 
GCCGGCAACG TCGACGGAGC CAAGTACGTC TACAGCGCGC TGCGCCCGGC CCTGCAGGAG 
AAGGACCCGG AGCTGGTGGC GACGCTCGAC AAGCGCTTCC CCGCGCTGGT CAGCCTGCTC 
GACAAGCACC TGGCCAAGCC GGGTGACAAC GGCTACATCC CCGGCAGCCC GTACATCTCC 
TACGACAGCC TCACCCAGGA CGAGGTCAAG GCCCTCGCCG TCGAGGTCGA CGCCATCTCC 
GAGCCCATCG GACAGATCGC CGGAGTCGTG ACCAGCAAGT GA

Protein sequence

MKSPVGRVMR LACPVVVAAT LAAACSSDNS SDSGTSGASG GPIAVNAGDK DCKVASAELP 
AGRHTFEVTN SASQVTEVYV YADGDRIMGE VENVGPSTKR NLIVDLPAGR YQVACKPGMV 
GDGIRTALTV TGEAAPPQTL DQNLQTAVTS YKTYVGSETQ ALVDTTAGFV EAINSGDLAK 
AKEAYPNVRL HYERIEPIAE SFGDLDPLID MRIDDATPGT PFVGFHAIEQ KLFEGNTLDG 
TQPLATTLTT NVGKLNELIK TVELTPLVMA NGAKSLLDEV AASKVTGEEE RYSRIDLVDF 
AGNVDGAKYV YSALRPALQE KDPELVATLD KRFPALVSLL DKHLAKPGDN GYIPGSPYIS 
YDSLTQDEVK ALAVEVDAIS EPIGQIAGVV TSK