Gene Franean1_4619 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4619
Symbol
ID	5672964
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	5508728
End bp	5509957
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	69%
IMG OID	641243480
Product	putative PAS/PAC sensor protein
Protein accession	YP_001508896
Protein GI	158316388
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG2208] Serine phosphatase RsbU, regulator of sigma subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGAGAGC CGAGGATCGA CTACGAGGCC GTTTTTCGGG CTCTCCCCAG CCCGACCTTG 
CTACTGACCC CTGAATTGAT CATACTTGCC GCCAACGAGA CATATCTTCA GGTGTCGGGG 
CGCACACGCG AGAACCTGCT GGGACGCTAC CTGTTCGACG CTTTCCCGGA CAATCCGGAG 
TACCGGTCCG CGTCAGCGGT GCGCGCACTT GGCGCGTCGC TACGGCGAGT GCTGGCCACC 
GGGGAGCGCG ACACCATGGC GGTCCAGCGT TACGACGTGG AGGCACCAGC GCGTCCAGAT 
GTGTTCGAGG AGCGGTACTG GAGCACGGTC AACACTCCGG TGCTTGATCC TGACGGGCAG 
GTGACGTTGG TGGTGCACCG GGTGGAGGAG GCGACCGACC TCGTCCGCAT GTGCGCCGGA 
GAAATGGGGG ACGACCGGCA GCACAGGCTG GAGGTGGAGC TGATGGCCCG TGCTCGGGAG 
CTGCACGAAG GCAACGAGCA GCTGCGTCGA ACTCACGCTC GGGAACGCGA GGTGGCCCTG 
GCACTCCAGG AAGCGATGCT GCCCACGCCC GCACCGACCG GGCACGTCAA GGCGGCAGTG 
CGGTACCAGC CCGCCGCCAG CACGATGAAC GTGTGCGGTG ACTGGTACGA CCTGGTGGAG 
CTATCCGAGG ACCGCGTCGC GGTGGCCGTG GGCGACGTCG TCGGCCACGG ACTGTCGGCC 
ACGGGCACGA TGGGCCAACT GCGCAGCGCA CTGAGCGCCA TGGTCCGAGT GGCCGACGGA 
CCCGCAGCCG CCCTGGACGT GCTGGACCTG TACGCACGGT CGGTAGAAGG CGCCGAGTCG 
ACCACCGTCG TGCAGGCGGT CGCCGACTAC GACACGCTCA CCGTCACCTA CAGCCGGGCA 
GGTCATCCGC CGCCGGCACT GGCGCACGTC GGCGGCGCCA TCGAGTTCCT CGACCAGACC 
GTCGACCCGC CGCTGGGCGC GAGCCCGGAA CACCTGCCCC GGTCCCAGGC CACCGCGACG 
TTCGCGGTCG GCGCCACGCT GACGCTGTAT ACCGACGGCC TGATCGAACG CCGCGGGGAG 
AACATCGACG TCGGGTTGTC CCGTCTTGCC GCCAGCCTCC GCCGCAACCC GGGACTTGAT 
CCGGAGGCAC TGGCCGATGC GCTGCTGGCC GAGGTGGGCG CGGACAGCGA GCCAGCCGAC 
GACACCGCCG TCGTCGTCGT CCGACTCTGA

Protein sequence

MGEPRIDYEA VFRALPSPTL LLTPELIILA ANETYLQVSG RTRENLLGRY LFDAFPDNPE 
YRSASAVRAL GASLRRVLAT GERDTMAVQR YDVEAPARPD VFEERYWSTV NTPVLDPDGQ 
VTLVVHRVEE ATDLVRMCAG EMGDDRQHRL EVELMARARE LHEGNEQLRR THAREREVAL 
ALQEAMLPTP APTGHVKAAV RYQPAASTMN VCGDWYDLVE LSEDRVAVAV GDVVGHGLSA 
TGTMGQLRSA LSAMVRVADG PAAALDVLDL YARSVEGAES TTVVQAVADY DTLTVTYSRA 
GHPPPALAHV GGAIEFLDQT VDPPLGASPE HLPRSQATAT FAVGATLTLY TDGLIERRGE 
NIDVGLSRLA ASLRRNPGLD PEALADALLA EVGADSEPAD DTAVVVVRL