Gene Franean1_2947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2947
Symbol
ID	5671333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3468102
End bp	3469235
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	68%
IMG OID	641241853
Product	hypothetical protein
Protein accession	YP_001507273
Protein GI	158314765
COG category	[S] Function unknown
COG ID	[COG3662] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.985948
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACC ACACCTCAAC CATCGAACCC ACCGCTGCGC CGCGGACGCT GACCGTCCCG 
ACAGCCGCCG CTCCGGTCCG TTCGGAAGAA GTCGACTGGG CGCTCGGTCC CGGCTCGGTT 
ACCTGGGAAG TCATGAAGGA CCCTGCCGTG TTCCTGGTCG GGCTGCTTCG AGAGGCCATT 
CTCCTGACGC TTCACCCACC GTTCGCCGCC GCCGCGATAG ATCATGACAG CTTTCTGGAT 
GACCCGGTGA TGAGGTTCCG GCGAGTGGCC ATGTACGCCT ACTCGGCCAC GTACGGCACC 
AAGGCTGACG CCGAGAGGGT CAGCGCGATG GTGCGTCGGC GGCACTTCCA GATCGTGGGC 
GTCGAGCCTC TGAGCGGCGA GCCGTACCGG GCAGACTCGG AGTACGAGCT GGCATTGACC 
CAGGCCATGC TGGCGGCGTC GTTCCTGGCG GTGTACGAGG AAGTCCACGG CCGCCTCTCC 
ACCGCCCGAC GTGACCAGTT CCTCATGGAG CAGAAGGTGC CCGCGGCGCT GCTGGGCGTA 
CCGCCCGAGC ACATGCCCTC GACGTGGGGT GATCTTCAGC GGTTCCTCGC CAGGGCGCGG 
GACGGCTTCG CCACCGGCTA CCAGGCCCGG GAGATCATCG ATCCCTTCTC CCGAGGCAGC 
TACCCGCCTG GTAGCGTGCT CGGGGACCTG CCGACACTGA AGCGACAGGC CGCTATGTGG 
CTGATCCGGG CGATCGCCGA CATGGCCATT CTCACCATGA ACGATGAGGA ACGCGCCCTC 
CTCGCGATCG ACCGACGGCC CAAGCTGCGG TCGCAGGCAG CAATCCGGCT CTCGCTCAGG 
GCACTGTCCC GGTACCTGCG TAGCGAGAAG GGAACGCTCG CCTTCGAGGG GTTCGTCAAG 
GCGAACACCG CGAAGATCAT GCGGCGAGCC TTCGAGGTCG ACAGGAAGCC GGGCCGCCGT 
GCCCGGGAAA AGGCATTCCG GGTCCCGGAC GCCGCCGGCT TCGTCGTCCA GCTGCCCGAC 
CTCGTGCACA ACTGGCCTGG CTCCCGGAGC ATCGCCGAGC AGCCGAAGCC AGTGGAGGGC 
CCGTCGGCTC ACGAGACTCG AGCCGGGGCC GGGAGAGCCC GCCGCGCCGG ATGA

Protein sequence

MTDHTSTIEP TAAPRTLTVP TAAAPVRSEE VDWALGPGSV TWEVMKDPAV FLVGLLREAI 
LLTLHPPFAA AAIDHDSFLD DPVMRFRRVA MYAYSATYGT KADAERVSAM VRRRHFQIVG 
VEPLSGEPYR ADSEYELALT QAMLAASFLA VYEEVHGRLS TARRDQFLME QKVPAALLGV 
PPEHMPSTWG DLQRFLARAR DGFATGYQAR EIIDPFSRGS YPPGSVLGDL PTLKRQAAMW 
LIRAIADMAI LTMNDEERAL LAIDRRPKLR SQAAIRLSLR ALSRYLRSEK GTLAFEGFVK 
ANTAKIMRRA FEVDRKPGRR AREKAFRVPD AAGFVVQLPD LVHNWPGSRS IAEQPKPVEG 
PSAHETRAGA GRARRAG