Gene Francci3_0437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0437
Symbol
ID	3903626
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	519384
End bp	521033
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	66%
IMG OID	637877769
Product	FAD dependent oxidoreductase
Protein accession	YP_479553
Protein GI	86739153
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGGT ACGACTATTC GGTTGCCATC CTCGGTAGCG GCATCGCCGG CTCGACGCTG 
GCCAATATCC TCGCCCGACA CGGTCACCGC GTGGTTCTGA TTGACAGTGG CACGCATCCA 
CGTTTCGCGC TCGGGGAGTC GACCATCGGT GAGACGACCT ATCTGCTGAA GTTGCTCGCC 
CAGCGGTTCG ACGTCCCCGA GCTCGGCCAT GTGAGCAGCT TCGAGGGCGT CCGCTCCCAC 
GTCACCTCGG CCTGCGGAGT GAAGCGCAAC TTCGGATTCG TCTACCACCA CGAGGGTGCG 
CTCCAGAACC CCGAAGAGGT CACTCAGTGC AGCGTTTCGG AGTTTCCGAA CGGCCCGGAA 
ATGCACATGC ACCGCCAGGA CATCGATGCT TACCTCTTCT ATACGGCCGT CCGTTACGGA 
GCCGAACCGC GGCAACGCAC GATGGTGGAA AAAGTCGACT TCGCCGACGA CGCCGCGACG 
CTGACGACAG GGGCCGGCGA ACGGATCCGC GTTCGCTACG TCGTCGACGC CTCAGGACGC 
AACTCCGTGT TGGCGAACCA GTTCGCCCTG CGAGAGGATC CCTGCCGGTT CCGGACGAAC 
TCCCGCACCC TGTTCACCCA CATGGTGGGG GTCACCCCCT TCGACGAGGT GACCCTCCCG 
AGCGGGCAGC CGTCGCTGTG GCACCAAGGC ACCCTGCACC ATCTGTTCGA CGGCGGCTGG 
CTGTGGGTGA TCCCGTTCGA CAATCACCAG CGGGCCACCA ACCCACTGTG CAGCGTCGGG 
CTCAACCTCG ACTCGCGACG CTTCCCCAGG GATCCCTCGG TACCCGCCGA GCAGGAATGG 
AACGCTTATC TTGAGCGGTT CCCCAGTATC GCGCGCCAGT TCGCCGGTGC CCGGCCCGCC 
TGGGACTGGA TCTCCACCGG TCGCACCCAG TACTCCAGCT CGCGGACGGT CGGTGACCGC 
TGGGCGATGA TGTCCCACGC AGCCGGGGCG ATCGACGCGC TGTTCTCCCG TGGCATGGCC 
AACACCATGC AGGTCATCTA CGCCCTCGCA CCAACCCTGA TAGAGGCCCT CGCCGACGAC 
GACTTCTCGG CGGAACGCTT CGGCCACATC GACACGCTCA ACCAGACGAT CCTGGACGTC 
AATGACAAGC TCGTACACGG CTCCTATGTC TCGTTCCGCG ACTTCGACCT GTGGCGGGCG 
TGGTCGAAGG TGTGGTTCCT GGGCTGGAAC ATGGGCATCT CCCGGATCGT CGGAACCTAC 
TTCGGCTATC TGGAAAAGGG CGATCCGGCG CTGTTCGACC GCCTGCTCGA CGCGCCACAT 
CTGGGCACTT TCTGCCCCGA TCTGCCGGAA TTCCAGCCCT TCTTCGACTC GCTCAGCGCC 
GTGATGGACG AGGTCGAGGC CGGCCGGCTG GCCCCGGCCG CCGCCGTCGA ACGGCTCGCC 
ACTCTGCTGG GCGGCGCCGA CTTCCTCCCC GCTCCGCTCC GGCTGGGCGA TGTGCTGCGC 
CGCTGGCACG ACGGCTCCTT CGAAGCCCAG CGCCGCATGT ACGAGTGGGG GCGCACGAGT 
TCCCCCGAGC CGCTCCGCCG CTGGTACGAG TACGACCTCG ACGACCTGCT CACCCGCACG 
GGTGGGGTGC CCACTCCGGC AACCCTCTAA

Protein sequence

MSGYDYSVAI LGSGIAGSTL ANILARHGHR VVLIDSGTHP RFALGESTIG ETTYLLKLLA 
QRFDVPELGH VSSFEGVRSH VTSACGVKRN FGFVYHHEGA LQNPEEVTQC SVSEFPNGPE 
MHMHRQDIDA YLFYTAVRYG AEPRQRTMVE KVDFADDAAT LTTGAGERIR VRYVVDASGR 
NSVLANQFAL REDPCRFRTN SRTLFTHMVG VTPFDEVTLP SGQPSLWHQG TLHHLFDGGW 
LWVIPFDNHQ RATNPLCSVG LNLDSRRFPR DPSVPAEQEW NAYLERFPSI ARQFAGARPA 
WDWISTGRTQ YSSSRTVGDR WAMMSHAAGA IDALFSRGMA NTMQVIYALA PTLIEALADD 
DFSAERFGHI DTLNQTILDV NDKLVHGSYV SFRDFDLWRA WSKVWFLGWN MGISRIVGTY 
FGYLEKGDPA LFDRLLDAPH LGTFCPDLPE FQPFFDSLSA VMDEVEAGRL APAAAVERLA 
TLLGGADFLP APLRLGDVLR RWHDGSFEAQ RRMYEWGRTS SPEPLRRWYE YDLDDLLTRT 
GGVPTPATL