Gene Rcas_0778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0778
Symbol
ID	5538244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1017886
End bp	1018863
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	45%
IMG OID	640892931
Product	polysaccharide biosynthesis protein CapD
Protein accession	YP_001430914
Protein GI	156740785
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1086] Predicted nucleoside-diphosphate sugar epimerases
TIGRFAM ID	[TIGR03589] UDP-N-acetylglucosamine 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.909827
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTGGC ATGAGGTAGT AGTACTTGTA ACGGGAGGCA CGGGCTCATT CGGTAAAAAG 
TTCGCCAAGA TAATGCTAGA GGATTATCAA CCTGAGAAGG TGATAATTTA CAGCCGAGAT 
GAGCTAAAGC AACATGAGAT GCGAATAGCG GGGTTTGATC ATCCCTCTAT ACGTTATTTC 
ATCGGTGATG TACGCGATTT AGCAAGACTA CGTCGTGCTA TGTATGGAGT GGACATCGTG 
GTTCATGCGG CTGCATTGAA GCAAGTTCCA GCTTGCGAAT ATAATCCTAT CGAGGCGGTC 
ATGACAAACA TTAACGGTGC AAGAAATGTT ATTGATGCTG CCATCGATAT GGGCGTAAAA 
AAGGTTGTGG CTATAAGTAC AGATAAGGCG GTAAATCCCG TGAATCTTTA TGGTGCCACC 
AAGCTTTGTG CTGAAAAACT GTTTATTCAA AGCAACTCCT ATTCAGGCAG TACCGGAACT 
CGCTTCAGTT GTGTACGCTA TGGTAACGTA GTTGGAAGCA GTGGTAGCGT AATCCCTCTT 
TTCCGAGAGC AACGGCGATC TGGTCGTATT ACCGTGACTG ATCCGAGAAT GACACGTTTT 
TGGATTACAT TAGATCAAGG CGTACGATTT GTTATTCGTT GCATTGAGCA AATGCATGGA 
GGGGAAGTGT TTGTTCCTAA GATTCCCAGT ATGAACATTA TGGACCTAGC AAAAGCAATA 
GCACCGGATT GCGTGGTGGA GTCCATCGGG ATTAGGCCCG GCGAGAAACT CCACGAAGTA 
TTAATTTCTG AAGATGAAGC ACGTCATACG TTAGAACTTG AAGATATGTA TGTTGTTCAG 
CCAAGATATC CATGGTGGCA GGTTAAGGAC TGGGAAGGAG GAAAGCCACT CCCTGAGGGT 
TTCCGGTATG CTAGTAACAC AAACAGTCAG TGGCTCTCGG TAAGTGAGCT ACGAGTATTA 
GCAGAGGACT TAATATGA

Protein sequence

MNWHEVVVLV TGGTGSFGKK FAKIMLEDYQ PEKVIIYSRD ELKQHEMRIA GFDHPSIRYF 
IGDVRDLARL RRAMYGVDIV VHAAALKQVP ACEYNPIEAV MTNINGARNV IDAAIDMGVK 
KVVAISTDKA VNPVNLYGAT KLCAEKLFIQ SNSYSGSTGT RFSCVRYGNV VGSSGSVIPL 
FREQRRSGRI TVTDPRMTRF WITLDQGVRF VIRCIEQMHG GEVFVPKIPS MNIMDLAKAI 
APDCVVESIG IRPGEKLHEV LISEDEARHT LELEDMYVVQ PRYPWWQVKD WEGGKPLPEG 
FRYASNTNSQ WLSVSELRVL AEDLI