Gene Francci3_3918 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3918
Symbol
ID	3906877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4685662
End bp	4687209
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	68%
IMG OID	637881245
Product	NADH dehydrogenase
Protein accession	YP_482997
Protein GI	86742597
COG category	[C] Energy production and conversion
COG ID	[COG1252] NADH dehydrogenase, FAD-containing subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.940984
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCTACG GGCAACCACC GCACATCCTC ATCGTCGGCG GAGGATACGT CGGCATGTAC 
ACGGCCCTGC GGCTGCGGCG GAAGCTGCGC CAGGACGAGG CATTGGTCAC AGTCGTCGAG 
CCCAACTCGT ACATGACCTA TCAGCCTTTC CTCCCGGAAG CGGCGGCCGG CAACCTTGAG 
CCACGGCACG TGGTGGTGCC GCTACGTAAG GTGCTGAAGG GCTGTCGGGT TGTCAGCGGA 
AGCGCGCTTC AGGTGTCGCA TGGGACACGG ACCGCCGTGA TCAAACCATC CCTTGGCGAG 
AAATTTGATC TTAAGTACGA CATCTTGGTG ATGTGTCCGG GATCGGTGGC GCGAACCCTG 
CCAATCCCAG GGCTCGCGGA GCAGGGCATC GGCTTCAAGA GCGCGGCCGA GGCCATTTAT 
CTCCGTAATC AGGTCATCAG CCGGTTGGAC GCGGCCGCCT CGGTGACCGA TCCCGCGGTC 
CGGCGCCGGG CGCTGACCTT TCTCTTCATC GGCGGAGGGT ATGCCGGAAT AGAGGCTCTT 
GCCGAGTTGG AGGACATGGC CCGCGATGCG TGTTCTTTCT ATCCTGATCT GAAACCGACG 
GATATGCGTT GGGTCCTCGT TGAAGCCGCC GGCCGTATTC TTCCCGAGGT TTCACCCGGA 
ATGGGGCTTT ATACCCTCCG GCAGCTCGAG CACCGGGGCA TCGACGTCAG GTTGAACACG 
CGGGTGGAGA GCCTGGTCGG TGGGCGGGTT GTGCTGAATA ACGGTGAGGA GTTCGACGCG 
GGCACCATCG TGTGGACGGC CGGGGTGCGG GCGAACCCGA TGCTGGCCGA CACGGATCTG 
CCCTTGGACG ATCAAGGCCG GGTGCGCGCG ACCGTCTTCC TGCAGATCGA CGGGGTGGGT 
GACGCGTGGG CCGCGGGTGA CTGCGCGGCC GTGCCCGACC TGACCAGGGG CGAGGATGTC 
ACGACCGGTC CCTCGGCCCA GCACGCCGTC CGCCAGGCTC GCCGGCTGGC CCTCAACATC 
CTCGCCGAGC TGCGCGGCGA GCCCCTCGAA CCATACGAGC ACAGCTATGC CGGCAGCGTG 
GCGTCCCTGG GCCTGCACAA GGGTGTCGCC GAGGTCTACG GGGTCAAGCT GCGCGGCTGG 
CCCGCCTGGT TCATGCACCG GACGTACCAC CTGAGCAGGG TTCCCACCCT CAACCGCAAG 
ACCAGGGTGG TCGCGGACTG GTCGTTGGCA CTGTTCTTCC GCCGCGAGAT CGTCTCGCTC 
GGATCCTTCG CCGATCCCCG GGCCGAGTTC CGCCGGGCGG CGATGCCGTC CGCGTTCGCC 
GCGGCCATCT CCCCAGGCAC GCCCGGCACT CCGGTCACGA CGACCGGGCG GAACGGGACC 
ACTCGCGCCC CCGCGTCCGC CGTCGCAGCC GACTCGCCCG GCGATGCCGA GGGCGGTGAG 
GCCGAGGGTG GTGAGGCCGC GTCCCCGGGT GAGGATGTCG TCCGGGCCGC ACCGACCGGC 
AGGATCTCCC GCGGCCGGAG CCGGACGCCC GGTCCGCGCG GCACGTGA

Protein sequence

MGYGQPPHIL IVGGGYVGMY TALRLRRKLR QDEALVTVVE PNSYMTYQPF LPEAAAGNLE 
PRHVVVPLRK VLKGCRVVSG SALQVSHGTR TAVIKPSLGE KFDLKYDILV MCPGSVARTL 
PIPGLAEQGI GFKSAAEAIY LRNQVISRLD AAASVTDPAV RRRALTFLFI GGGYAGIEAL 
AELEDMARDA CSFYPDLKPT DMRWVLVEAA GRILPEVSPG MGLYTLRQLE HRGIDVRLNT 
RVESLVGGRV VLNNGEEFDA GTIVWTAGVR ANPMLADTDL PLDDQGRVRA TVFLQIDGVG 
DAWAAGDCAA VPDLTRGEDV TTGPSAQHAV RQARRLALNI LAELRGEPLE PYEHSYAGSV 
ASLGLHKGVA EVYGVKLRGW PAWFMHRTYH LSRVPTLNRK TRVVADWSLA LFFRREIVSL 
GSFADPRAEF RRAAMPSAFA AAISPGTPGT PVTTTGRNGT TRAPASAVAA DSPGDAEGGE 
AEGGEAASPG EDVVRAAPTG RISRGRSRTP GPRGT