Gene Franean1_5933 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5933
Symbol
ID	5674254
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7205853
End bp	7206947
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	69%
IMG OID	641244781
Product	adenosine deaminase
Protein accession	YP_001510183
Protein GI	158317675
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1816] Adenosine deaminase
TIGRFAM ID	[TIGR01430] adenosine deaminase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.2838
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0016274
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGGACATCC CTGCTGGCCA GGCCAGCGAG AAGATCACTG AGGCTGCGAT CCGCCGGGTT 
CCCAAGGTCC TGCTGCACGA TCATCTTGAT GGTGGCCTGC GGCCCGCGAC CATCGTCGAG 
CTGGCTGACG CCACCGGGTA CACCAGGCTG CCGACGACCG ATGTCGACAA GCTCGGTACC 
TGGTTCCGCG GAGGTGCGCA CACCGGGTCG CTCGTGCGGT ACCTGGAGAC GTTCAGCCAC 
ACGGTGGGCG TCATGCAGAC GCCCGAGGCC GTGGCCCGGG TGGCCCGCGA GTGCGCCGAG 
GATCTGGCCG CCGACGGGGT CGTCTACGCG GAGGTCCGGT TCGCCCCGGA GCTCCACGTC 
GAGCAGGGCA TGTCGCTCGA CGAGGTGGTC GAGGCCGCGT TGGACGGCTT CCGCGCCGGC 
TCGGCGGGAA CCGGCCTGCA CGTGCGCGCG CTGGTGACCG CCATGCGCCA CCAGGCCCGC 
TCGTTGGAGA TCGCGGAGCT GGCCGTCCGG TGGCGGGAGG CCGGGGTGGT CGGGTTCGAC 
ATCGCCGGGG CGGAGGCGGG CAACCCGCCG ACCCGCCACC TGGACGCGTT CCAGTACATC 
CAGCGGGCGA ACGGGCACTT CACGATCCAC GCGGGTGAGG CGTTCGGGCT GCCGTCGATC 
TGGGAGGCGC TGCAGTGGTG CAACGCCGAC CGGCTGGGGC ACGGCGTGCG CATCGTCGAC 
GACATCACGG TCGACCCGGA CGGAAACGCC ACCCTCGGGG ATCTGGCCGA CTATGTGCGC 
GATGTCCGTG TCCCGCTGGA GATGTGCCCG TCGTCGAACG TGCACACCGG GGCGGCGCCG 
AGCATCGAGC GCCATCCGAT CGGTCTGCTG CGCAGGCTGC ACTTCCGGGT CACGGTGAAC 
ACCGACAACC GGCTGATGAG CGGGGTGACG CTGTCCAGCG AGTTCGCGAC CCTGGTCGAG 
ACGTTCGGCT ACGGCTGGTC CGACATCCGC TGGCTGACCG TGAACGCGAT GAAGTCTGCC 
TTCCTCCCAT TTGACCAGCG TCTCGCGCTG ATCAACGAGG TCATCAAGCC CGGCTTCGAG 
GGGCTCGTCC CGTGA

Protein sequence

MDIPAGQASE KITEAAIRRV PKVLLHDHLD GGLRPATIVE LADATGYTRL PTTDVDKLGT 
WFRGGAHTGS LVRYLETFSH TVGVMQTPEA VARVARECAE DLAADGVVYA EVRFAPELHV 
EQGMSLDEVV EAALDGFRAG SAGTGLHVRA LVTAMRHQAR SLEIAELAVR WREAGVVGFD 
IAGAEAGNPP TRHLDAFQYI QRANGHFTIH AGEAFGLPSI WEALQWCNAD RLGHGVRIVD 
DITVDPDGNA TLGDLADYVR DVRVPLEMCP SSNVHTGAAP SIERHPIGLL RRLHFRVTVN 
TDNRLMSGVT LSSEFATLVE TFGYGWSDIR WLTVNAMKSA FLPFDQRLAL INEVIKPGFE 
GLVP