Gene Franean1_1174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1174
Symbol
ID	5669587
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1398391
End bp	1399494
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	75%
IMG OID	641240106
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001505534
Protein GI	158313026
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0600] ABC-type nitrate/sulfonate/bicarbonate transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0829949
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.133993
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACTG ACACCGACAC GGTCTCCGGC CTCTCCCTCG AGGCCAGCAC CGAGGCCGAC 
GGCCGGGGCA CCGGTCCGGT CCCGGGCGCC CGCCCCGTGG CCGCCGGCCC CGCCGCCCCG 
GCACAGCGGA CGTCCGACGA GGCGCTCGCC GGCCTGGACG CCCTCGACCT CCCCGTCTCG 
TCCGGGCGGC CGACCGCGGG CCGGATCTGG TCGGTGACCT GGCCGAAGAT CGCCGCGCTC 
GCGCTGTTCC TGCTCGTCTG GCAGATCGTC GTCTGGTCGG GGTGGAAGCC CACCTACGTG 
CTGCCCGGCC CCGGCGACAC GCTGCCGGAG TTCTTCGACC AGCTCGGCAC CGCCGAGTTC 
TGGGACGCGT TCGGCCGCAC GCTGACCCGC GCCGGCGAGG GCTACGCGGT GGCGGTCGTG 
CTCGGCGGCG TCGTCGGCCT GGTGGTCGCC CGGTTCGGCC TGCTACGCGC GGCGGTGGGG 
TCGTTCATCA CCGCGTTGCA GACCATGCCG TCGGTGGTCT GGGTCCCGCT CGCGATCCTG 
CTGTTCAAGC TCAACGAGTC CGCGATCATG TTCGTCGTGG TCCTGGGCGC CGCCCCGTCC 
GTGGCGAACG GCGTCATCTA CGGCGTCGAC TACGTCCCGC CGCTGCTCGT GCGGGTCGGG 
CGCAGCATGG GGGCGCGCGG GTTCTCGCTG TACCGCCACG TCGTGGCGCC GGCGGCGTTC 
CCCTCGGTGC TCGCCGGGCT CAAGCAGGGC TGGGCGTTCG CCTGGCGCAG CCTGATGGCC 
GGCGAGCTGA TCGTCATCGT GCCCGGGCAC CCCTCGATCG GCGCCGACCT GCAGAACGCC 
CGGGACCTGT CGGACACCGT CGGCGTGATG GTGTCGATGC TGACGATCTT CGTGATCGGG 
GTCGCCGTCG ACGCGGTCTT CAACGCGTTC GACCTGCGGA TGCGCCGGCG GCGCGGCCTG 
CTCGCCGAGG GCTCCGACGC CGTGCGGGCC GCCCGCCGGC CCGGGCGGGG CCCAGCCACC 
GCCAACGCCG GCGGGCCGGT GCACACCGAC GGCCCGGCGG GGAGCTCGGC CGACGGTCCG 
GCCGGCGGCG ACTCGAGCAG CTGA

Protein sequence

MATDTDTVSG LSLEASTEAD GRGTGPVPGA RPVAAGPAAP AQRTSDEALA GLDALDLPVS 
SGRPTAGRIW SVTWPKIAAL ALFLLVWQIV VWSGWKPTYV LPGPGDTLPE FFDQLGTAEF 
WDAFGRTLTR AGEGYAVAVV LGGVVGLVVA RFGLLRAAVG SFITALQTMP SVVWVPLAIL 
LFKLNESAIM FVVVLGAAPS VANGVIYGVD YVPPLLVRVG RSMGARGFSL YRHVVAPAAF 
PSVLAGLKQG WAFAWRSLMA GELIVIVPGH PSIGADLQNA RDLSDTVGVM VSMLTIFVIG 
VAVDAVFNAF DLRMRRRRGL LAEGSDAVRA ARRPGRGPAT ANAGGPVHTD GPAGSSADGP 
AGGDSSS