Gene EcolC_1944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1944
Symbol
ID	6068527
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2148006
End bp	2151062
Gene Length	3057 bp
Protein Length	1018 aa
Translation table	11
GC content	54%
IMG OID	641601356
Product	FAD linked oxidase domain-containing protein
Protein accession	YP_001724917
Protein GI	170019963
COG category	[C] Energy production and conversion
COG ID	[COG0247] Fe-S oxidoreductase [COG0277] FAD/FMN-containing dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000150005
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTCCAC AGATTTCCCA GGCACCCGGC GTCGTTCAAC TGGTGCTTAA TTTTTTGCAA 
GAGCTGGAGC AACAAGGTTT TACCGGCGAT ACGGCGACAA GTTATGCCGA TCGTCTGACA 
ATGTCGACCG ACAACAGTAT TTACCAACTT CTCCCCGATG CGGTGGTATT TCCGCGTTCA 
ACCGCAGATG TGGCGCTGAT CGCCCGTCTT GCCGCGCAGG AACGCTATTC ATCGCTGATC 
TTTACCCCCC GCGGCGGCGG CACCGGCACT AACGGTCAGG CGCTCAACCA GGGGATTATT 
GTTGATATGT CCCGCCATAT GAACCGCATC ATCGAAATTA ACCCTGAAGA GGGCTGGGTG 
CGCGTTGAGG CCGGGGTGAT AAAAGATCAA CTCAATCAGT ACCTGAAACC GTTCGGCTAC 
TTTTTTGCGC CGGAACTTTC GACCAGCAAC CGGGCAACGC TCGGTGGGAT GATCAATACC 
GATGCATCCG GTCAGGGATC GCTGGTCTAT GGCAAAACGT CAGATCACGT ACTTGGCGTA 
CGCGCGGTGT TGTTGGGGGG CGATATTCTC GATACGCAAC CTTTACCCGT CGAATTGGCG 
GAAACGCTGG GTAAATCCAA TACCACAATC GGGCGAATTT ATAACACGGT TTATCAACGT 
TGCCGTCAGC AACGCCAGTT AATCATCGAC AACTTCCCCA AACTTAACCG CTTTCTTACC 
GGTTACGATC TGCGTCATGT CTTTAACGAT GAGATGACCG AGTTCGACCT GACGCGCATT 
CTGACGGGTT CAGAAGGGAC GCTGGCCTTT ATTACCGAAG CGCGGCTGGA TATTACGCCC 
TTGCCTAAAG TGCGCCGTCT GGTGAACGTC AAATATGACT CTTTTGACTC CGCGCTGCGT 
AACGCGCCGT TTATGGTTGA GGCGCGGGCG CTTTCGGTAG AGACGGTGGA CTCAAAAGTG 
CTGAATCTGG CGCGGGAAGA TATTGTCTGG CATTCCGTCA GCGAGTTGAT TACCGATGTG 
CCTGACAAAG AGATGCTCGG GCTGAACATT GTGGAGTTTG CTGGTAATGA TGAGGCGCTG 
ATTGACGAGC GAGTTAATGC TCTCTGTGTG CGGCTTGATG AGCTGATTGC CAGCCAACAG 
GCAGGTGTGA TTGGCTGGCA GGTGTGCCGC GAGCTGGCGG GTGTTGAACG TATCTATGCG 
ATGCGTAAAA AAGCCGTTGG TCTGCTTGGC AATGCCAAAG GTGCCGCTAA GCCAATTCCG 
TTTGCTGAGG ATACCTGCGT ACCGCCGGAA CATCTGGCCG ATTATATTGC TGAATTTCGC 
GCGCTGCTCG ACAGCCACGG CTTAAGCTAC GGTATGTTCG GTCACGTCGA CGCAGGTGTC 
TTGCACGTCC GTCCAGCGCT GGATATGTGC GATCCTCAAC AAGAGATTTT GATGAAGCAA 
ATCTCTGATG ACGTAGTGGC GCTGACTGCG AAATACGGTG GTTTGTTGTG GGGCGAGCAC 
GGCAAAGGTT TTCGCGCTGA ATACAGCCCG GCGTTTTTCG GTGAGGAACT TTTTGCAGAA 
CTGCGCAAAG TGAAAGCGGC ATTTGACCCG CATAACCGAC TCAACCCAGG GAAGATTTGC 
CCGCCAGAAG GTCTCGATGC GCCGATGATG AAAGTGGACG CGGTGAAGCG CGGTACATTC 
GATCGGCAGA TCCCCATTGC GGTACGCCAG CAGTGGCGCG GTGCGATGGA GTGTAACGGC 
AACGGTTTAT GCTTCAACTT TGATGCCCGT AGTCCGATGT GTCCGTCGAT GAAGATCACC 
CAGAACCGGA TTCATTCACC GAAAGGGCGC GCAACGCTGG TGCGTGAATG GCTGCGTTTG 
TTGGCGGATC GCGGCGTTGA TCCACTCAAA CTGGAACAAG AACTGCCTGA ATCCGGCGTC 
AGTTTGCGGA CGTTAATTGC CCGCACGCGC AATAGCTGGC ATGCGAATAA AGGCGAATAT 
GACTTCTCAC ACGAAGTCAA AGAGGCGATG TCGGGCTGTC TGGCCTGTAA AGCGTGTTCG 
ACCCAGTGCC CCATCAAAAT TGATGTGCCG GAGTTTCGCT CTCGTTTTCT GCAGCTCTAT 
CACACCCGTT ATTTACGTCC GCTGCGCGAC CACCTCGTCG CTACGGTCGA GAGCTACGCG 
CCGCTGATGG CACGTGCGCC GAAAACCTTT AACTTCTTCA TTAACCAGCC GCTGGTGCGC 
AAACTCTCGG AAAAACATAT CGGCATGGTT GATTTGCCAC TGCTGTCGGT CCCCTCGCTA 
CAACAACAAA TGGTGGGGCA TCGCTCGGCA AACATGACGC TGGAACAGCT TGAAGCTCTC 
AATGCAGAGC AGAAAGCGCG CACGGTGTTG GTGGTGCAGG ACCCCTTTAC CAGCTATTAC 
GATGCGCAAG TGGTGGCGGA TTTTGTCCGT CTGGTCGAAA AATTAGGTTT CCAGCCTGTG 
TTACTGCCAT TTTCACCAAA TGGCAAAGCC CAGCATATCA AAGGCTTTCT TAATCGTTTT 
GCGAAGACGG CGAAAAAGAC GGCGGATTTC CTCAACCGTA TGGCGAAGCT GGGTATGCCA 
ATGGTAGGCG TCGATCCGGC GCTGGTACTT TGTTATCGCG ATGAATATAA ACTGGCACTG 
GGCGAGGAAC GTGGCGCGTT TAACGTCTTA CTGGCGAATG AATGGCTGGC AAGCGCACTT 
GAGTCACAGC CAGTGGCTAC AGTCAGCGGT GAATCATGGT ATTTCTTTGG TCACTGTACC 
GAAGTTACCG CCTTGCCGGG TGCGCCAGCA CAATGGGCCG CGATATTTGC CCGTTTTGGC 
GCGAAACTGG AAAATGTCAG CGTGGGTTGC TGCGGCATGG CAGGGACTTA CGGACATGAA 
GCGAAAAACC ATGAAAATTC GCTCGGGATC TATGAGTTAT CCTGGCATCA GGCTATGCAG 
CGACTGCCGC GTAACCGCTG TCTGGCGACC GGATATTCCT GCCGTAGCCA GGTAAAACGG 
GTTGAAGGCA CGGGGGTACG CCATCCTGTG CAGGCTTTAC TGGAGATTAT TAAATGA

Protein sequence

MIPQISQAPG VVQLVLNFLQ ELEQQGFTGD TATSYADRLT MSTDNSIYQL LPDAVVFPRS 
TADVALIARL AAQERYSSLI FTPRGGGTGT NGQALNQGII VDMSRHMNRI IEINPEEGWV 
RVEAGVIKDQ LNQYLKPFGY FFAPELSTSN RATLGGMINT DASGQGSLVY GKTSDHVLGV 
RAVLLGGDIL DTQPLPVELA ETLGKSNTTI GRIYNTVYQR CRQQRQLIID NFPKLNRFLT 
GYDLRHVFND EMTEFDLTRI LTGSEGTLAF ITEARLDITP LPKVRRLVNV KYDSFDSALR 
NAPFMVEARA LSVETVDSKV LNLAREDIVW HSVSELITDV PDKEMLGLNI VEFAGNDEAL 
IDERVNALCV RLDELIASQQ AGVIGWQVCR ELAGVERIYA MRKKAVGLLG NAKGAAKPIP 
FAEDTCVPPE HLADYIAEFR ALLDSHGLSY GMFGHVDAGV LHVRPALDMC DPQQEILMKQ 
ISDDVVALTA KYGGLLWGEH GKGFRAEYSP AFFGEELFAE LRKVKAAFDP HNRLNPGKIC 
PPEGLDAPMM KVDAVKRGTF DRQIPIAVRQ QWRGAMECNG NGLCFNFDAR SPMCPSMKIT 
QNRIHSPKGR ATLVREWLRL LADRGVDPLK LEQELPESGV SLRTLIARTR NSWHANKGEY 
DFSHEVKEAM SGCLACKACS TQCPIKIDVP EFRSRFLQLY HTRYLRPLRD HLVATVESYA 
PLMARAPKTF NFFINQPLVR KLSEKHIGMV DLPLLSVPSL QQQMVGHRSA NMTLEQLEAL 
NAEQKARTVL VVQDPFTSYY DAQVVADFVR LVEKLGFQPV LLPFSPNGKA QHIKGFLNRF 
AKTAKKTADF LNRMAKLGMP MVGVDPALVL CYRDEYKLAL GEERGAFNVL LANEWLASAL 
ESQPVATVSG ESWYFFGHCT EVTALPGAPA QWAAIFARFG AKLENVSVGC CGMAGTYGHE 
AKNHENSLGI YELSWHQAMQ RLPRNRCLAT GYSCRSQVKR VEGTGVRHPV QALLEIIK