Gene Cwoe_3812 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_3812
Symbol
ID	8734267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	-
Start bp	4049829
End bp	4050926
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	69%
IMG OID	646504434
Product	NMT1/THI5 like domain protein
Protein accession	YP_003395604
Protein GI	284045264
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.424332
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGCTG CCCGTCGCCT GCGGTCCCTC CGCCTGCTTG CCCTGGCCGT CTTCGCGCTG 
GTCGGCCTGG TCGTCGTGTC TGGCTGCGGC AGCAGCGATG ACGACTCTGG TGGCGGCCAG 
ACGACCGCGG CTGCTGGAGG CAGCGGCGGC GGCGAGACGT CGAAGATCAA GCTCCAGTAC 
GGCTGGACGG TCGACGAAGG GTTGATCGGC GAGGTCGTCG CGATCGAGGA GGGCTTCTTC 
GAGGCCGAAG GGCTCGACGT CGAGATAGTC CCCGGCGGCC CGAACAACGA CGGCGTCGCC 
TCGGTCGCCT CCGGACGAGC CCAGATCGGC GTCGCGTCCG AGAGCCCGCC GGTGATGCTC 
GCCGCCTCCC AGGGGATCCC GGTGCAGGCG TTCGCCGCGC AGCTCCAGTC GCACCCGTAC 
GCCTACTTCG CGCTGCCGGA CACGCAGCTC GACTCGCCCG AGGACCTGAA GGGCAAGTCG 
GTCGGCGTGC CGCCGCCGGC CGTCGGCATG CTCGACGCGT ACCTGAAGGA CAACGGCATG 
ACGAAGGACG ACCTCGACAG CGTCAAGTCG GTCTCCTTCG ACGTCGCGCC GCTGCTGCAG 
AGACGCGTCG ACGTGTGGGG CGGCTGGCTG ACCGACCGCG CGCAGCTGAG ACTGCTGCCG 
GAGGGCTACA GAGTTCTGCC GTACGCCGAG AGCGTCCCGC TCTACGGCGG CACCTACTAC 
GCCAACCCGA GATTCCTCGC CGGCGACAGA GACAAGGCCG AGGCGTTCCT GCGCGCGGTC 
GCCAGAGGCT GGGCGTTCGC GAAGAGAGAC CCGGAGGCGG CGGCGAGAAT ATTCGTCGAG 
GCGTACCCCA ACTCCGAGGG CAAGTCGACG ATCGAGTCGA TCGTTGAGGC GCAGGAGACG 
CTGTTCCCGT TCATGTGGAC GGAGACGAGC GAGACCGGCG GCTACGGCGC GATGGACCCG 
GCGGCCTGGC AGGAGCAGCT CGACCTGTGG GAGCAGACCG GCCAGTTCGA CAGAGGTGAC 
GTCCCGACGG TCGAGGAGGT CATGACGACC GACATCCTCG ACGCCACCAG AGATGACCGC 
ACTGCACTCG CGAAGTGA

Protein sequence

MRAARRLRSL RLLALAVFAL VGLVVVSGCG SSDDDSGGGQ TTAAAGGSGG GETSKIKLQY 
GWTVDEGLIG EVVAIEEGFF EAEGLDVEIV PGGPNNDGVA SVASGRAQIG VASESPPVML 
AASQGIPVQA FAAQLQSHPY AYFALPDTQL DSPEDLKGKS VGVPPPAVGM LDAYLKDNGM 
TKDDLDSVKS VSFDVAPLLQ RRVDVWGGWL TDRAQLRLLP EGYRVLPYAE SVPLYGGTYY 
ANPRFLAGDR DKAEAFLRAV ARGWAFAKRD PEAAARIFVE AYPNSEGKST IESIVEAQET 
LFPFMWTETS ETGGYGAMDP AAWQEQLDLW EQTGQFDRGD VPTVEEVMTT DILDATRDDR 
TALAK